• 我的订阅
  • 头条热搜
京东云发布八大领先智算产品,助力企业火速用上大模型
...云DeepSeek大模型一体机,通过自研的算力池化能力、智能推理加速引擎,充分融合软硬件,实现了性能的全面提升,推理速度提升50%,企业可以根据自己的需求灵活选择不同版本,开箱即用。目前,在河南鹤壁、江苏宿迁、山东...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
加码“AI+编程教育”!商汤科技与编程猫达成战略合作
...。人工智能时代,编程已成为未来世界的通用语言、培养下一代创新者的关键工具。作为点猫科技旗下人工智能和编程教育品牌,编程猫面向全球青少年提供覆盖全年龄段和多种编程语言的线上课程、线下学习、赛事等考等服务...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
openai计划推出新型人工智能模型
...TadaoNagasaki)指出,尽管GPT-3与GPT-4的性能相差不大,但是下一代模型GPTNext预计将实现质的飞跃,其性能预计将提升100倍。 ……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
文 | 周鑫雨编辑 | 邓咏仪36氪获悉,AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资,启赋资本、达晨财智领投,老股东奇绩创坛跟投。此前,清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。图源:OpenAI考虑到o1模型不需要额外加钱就...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
联想AI PC明年9月上市,黄仁勋苏姿丰同台宣布拓展AI合作
...各行各业的智能化转型,探讨如何设计、推动和重新定义下一代人工智能设备、基础设施、解决方案和服务,以加速为企业和消费者带来真正的人工智能驱动成果。联想Tech World 2023推出AI PC,明年9月上市,定位高端市场人工智能...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...换机芯片来搭建集群,后期也会考虑与合作伙伴共同研发下一代大规模交换机,持续发展卡间通信。 在框架和算法层面,夸娥万卡集群支持多种自适应混合并行策略与高效显存优化,可根据应用负载选择并自动配置最优的并行...……更多
...“小驰”的“聊天”将更加天马行空。“DeepSeek擅长逻辑推理,我们的DFM-2大模型具备跨多个专业垂直领域的综合大模型集合能力,能够学习和利用DeepSeek的逻辑推理能力,并基于在各个垂直领域的应用经验,多维度提升DFM大模型...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
本文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
更多关于社会的资讯:
2025·人工智能+未来产业发展大会亮点抢先看!
2025年12月8日-9日,备受瞩目的2025·人工智能+未来产业发展大会将在广州越秀国际会议中心召开。大会以“谋赛道・塑优势・聚产业”为主题
2025-12-07 16:43:00
黑熊“袭击”饲养员后 杭州野生动物世界致歉:取消黑熊行为展示
华商网讯 12月7日,杭州野生动物世界有限公司发布公告。公告称,2025年12月6日15时50分,该园在动物行为展示期间
2025-12-07 15:40:00
承认性侵,韩国男演员赵震雄退出娱乐圈
12月6日,《信号》主演、49岁韩国演员赵震雄通过所属公司宣布退圈:“因过去的不当行为,令一直信任和支持我的所有人失望
2025-12-07 11:27:00
“300多个错误,一个比一个离谱……”上海古籍出版社致歉:全面下架,深感愧疚
12月2日,教育博主“北大一五老师”发文表示:上海古籍出版社著名的“国学典藏”系列之一,李保民点校版《西厢记》,错误之多
2025-12-07 11:26:00
长白时评评论员 久泰平到12月7日,为期五天的吉林雪假悄然落幕。不同于寻常假期的匆匆而过,这场以冰雪为主题的专属时光,不仅为孩子们的童年相册添上了斑斓一页
2025-12-07 07:16:00
为进一步贯彻落实习近平文化思想,深化推进“杭州文化研究工程”,12月6日,由浙江大学主办,杭州城市文化研究中心(浙江大学杭州文化研究中心)
2025-12-07 07:21:00
12月6日,从太原市保障性住房开发建设有限公司(以下简称市保障房公司)了解到,12月8日至12月13日,将在小店区长治路109号阳光国际酒店3层阳光厅举行“锦绣汾东”项目的选房活动
2025-12-07 07:32:00
农业银行青州益都支行在下班前五分钟接待了这样一位客户,她手提一兜零钱进入,问工作人员还能不能存上这些零钱,说自己今天来的晚了点
2025-12-07 07:46:00
这两天,踏入杭州市第十二届老年生活博览会的“科技+养老”的特展区,空气里弥漫着一种安静却充满力量的氛围。不再是沉重的负担
2025-12-07 07:52:00
12月5日,2025年度“杭州市诚信艺术机构评选”结果揭晓。经过严格评审,全市共有10家单位荣获“2025年度杭州市艺术品行业诚信艺术机构”称号
2025-12-07 07:52:00
12月6日,“洞天行履——宋人自然秩序的审美转译”第二届宋韵艺术美学论坛暨第十届“两宋论坛”研讨会在中国国际设计博物馆举行
2025-12-07 07:52:00
最近,不少杭州市民收到了这样一条短信:“尊敬的用户,由于业务升级,您之前办理的‘绑卡租车’功能即将在2025年12月底取消
2025-12-07 07:52:00
厦门网讯(厦门日报记者 卫琳)昨日,民建厦门市委召开第十八届中小企业发展年会暨AI赋能生态大会,围绕“智创生态,赋新致远——AI与中小企业创新融合”主题
2025-12-07 08:04:00
剧院“演奏家”进公园 市民现场点歌不亦乐乎
这里没有预告,无需门票,甚至没有一张正式的座椅。在北京紫竹院公园的竹林深处,当熟悉的旋律响起,往来的游客便会驻足,汇聚成里三层外三层的听众
2025-12-07 07:52:00
上门换俩灯泡,收费240元。不久前,消费者张先生预约上门维修服务时的遭遇,让不少网友产生共鸣。便宜材料高价卖,人工费用糊涂账
2025-12-06 07:47:00