• 我的订阅
  • 头条热搜
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来
...着黄仁勋演讲开始有所走高,但收盘仍跌超3%。代理AI和推理将推动算力增长,数据中心支出将达到1万亿美元 在演讲开始,黄仁勋对比了基于Blackwell架构的GeForce 5090芯片和RTX4090的进步。“它体积缩小了30%,能效散热提升30%,性...……更多
会见企业家|周鸿祎:开源才是真正难以逾越的壁垒,中美AI技术将交替领先
...力,云服务商通过算力需求激增获益,国产芯片厂商则借推理算力优化实现弯道超车,对于英伟达而言,也是好事,英伟达服务器需求随着使用算力的人数增加而增加。“很多人老是津津乐道具体技术细节,但技术并不是别人不...……更多
大江东|在首届浦江AI学术年会,感受人工智能加速跑
...,“我希望通过因果智能研究,让大模型今后拥有强大的推理能力,能够从大数据中发现数据之间的因果关系,这样就能形成新的知识。”“我们正在把大模型和因果推理方法联系起来,让大模型去寻找纷繁复杂世界中的因果关...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...图像的任意组合作为输入,实时对音频、视觉和文本进行推理,生成相应的输出。相比ChatGPT的文生文、文生图,Sora的文生视频等,GPT-4o是一个原生多模态的融合体。这一点,谷歌的Gemini Astra也能实现,支持多模态的推理。在演...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
世界首款人形机器人模型正式亮相,距离真正进入生活还有多久?
...人的普及,还离不开产业链上游的大模型产业、模型训练推理的基础设施算力产业链的成熟度。从国内来看,人形机器人产业已经驶入快速发展和追赶国际先进技术的阶段。2023年底,为推动人形机器人产业高质量发展,工业和...……更多
近日,我国“深度求索”公司发布的具备深度思考和推理能力的开源大模型 DeepSeek-R1 受到了全世界的关注。在 DeepSeek-R1 之前,美国 OpenAI 公司的 GPT-o1,Athropic 公司的 Claude,Google 公司的 Gemini,都号称具备了深度思考和推理能力..……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
OpenAI迄今最大、最贵模型!GPT-4.5正式发布
...题方面发挥更大作用,并且模型的幻觉现象更少,但数学推理能力仍逊于o3-mini等推理模型。GPT-4.5是OpenAI最后一个“非思维链模型”,通过扩大预训练和后训练规模,提升了非监督学习能力,未来将作为推理模型的基础。不过目...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话...……更多
ChatGPT一周年,机会在大厂还是小公司?
...。大模型还存在一些不足,包括如何做更高效果的架构、推理加速,训练加速等。如果面向未来智能体的发展,大模型仍然有很多模块欠缺,比如记忆能力、推理能力、规划能力等,包括现在大模型背后的一些机理,都不足以支...……更多
谷歌发力世界模型:从OpenAI挖来Sora核心负责人!
...通向通用人工智能(AGI)的关键路径。世界模型将为视觉推理与模拟、代理规划以及实时互动娱乐等多个领域提供强大动力。”据悉,“世界模型”是目前技术流派中难度最高的一种,其特点在于让机器能够像人类一样对真实世...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
人工智能应用场景不断拓展
...下一代的模型须具备更大规模、更复杂、更多层次的逻辑推理能力,全世界先进模型的投入门槛将达到数十亿、数百亿美元的级别。清华大学人工智能研究院副院长朱军说,大模型的发展一方面要让消费者参与和交互,另一方面...……更多
...不需要什么“万卡集群”,有时一张卡就可以完成训练和推理工作,输出的内容也更准确,效果更好。但也要注意,设计和训练专用大模型依然需要相当专业的知识和经验,包括高水平的设计者、跨学科合作,并通过高效的算法...……更多
不听人类指挥 OpenAI模型拒绝关闭
...,但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。美国AI安全机构帕利塞德研究所说,o3破坏关闭机制以...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...,从跨模态预训练、到下游任务的微调都可以完成。而在推理端,他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中,可能只需要针对AI模型本身进行推理优化,就能在...……更多
...在缺乏参考的情况下,成功复现媲美 OpenAI o1 模型的深度推理能力,而且应用程序接口(API)价格仅为后者的 1/30;此前DeepSeek V3 模型通过模型架构和基础软硬件的深度集成优化,实现与 GPT-4o 相当模型能力的同时,单次训练成本...……更多
...司利用自主研发的训练框架和量化算法显著提升了训练和推理速度,并优化了模型精度与推理吞吐量;在智能安全保障上,公司采用RLHF方案对齐安全认知,创新的热修复技术确保了大模型的安全性,提供安全、可靠的用户体验...……更多
AI泡沫不可避免!李彦宏敲响警钟:PMF是生存关键
...苹果研究员最近发布了一篇名为《理解大语言模型中数学推理局限性 》的论文,质疑大语言模型的数学推理能力,甚至认为大语言模型不具备真正的推理能力,放弃造车、战略押注AI的苹果甚至放弃了OpenAI的新一轮投资机会。与...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...最终Genie使用该专有数据进行训练。数据集中编码了人类推理的完整过程,包括完美的信息溯源、增量知识发现,还有基于软件工程师实际工作案例的逐步决策过程。Genie的推理过程包括规划、检索、代码编写和代码运行四个主...……更多
更多关于科技的资讯:
摘要:本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析,探讨薪资分布的现状及其影响因素。研究发现,一线城市和二线城市在薪资水平上存在显著差异
2025-12-03 06:16:00
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00
GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书,成为兼具安全性
2025-12-02 14:27:00
从梅酒到书籍:梅见的文化升维之路
步入繁华的商业街区,不难发现一个耐人寻味的现象:店铺橱窗中的传统文化元素,正以近乎重复的方式不断上演。印着汉字 logo 的T恤
2025-12-02 14:35:00
丝玫瑰携手首玺丽格 科创驱动美力升级
2025年12月2日,由键凯科技旗下医美产品线品牌——丝玫瑰®(SILKROSE)与北京首玺丽格联合举办的“中国‘智’造
2025-12-02 15:35:00
白酒+体育IP重构行业营销新范式,五粮液世界杯联名款京东首发
鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日,五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市
2025-12-02 15:36:00
从“车间老师傅”到“门店销冠”:飞书AI正在重塑吉利汽车研究院、亚朵酒店的一线战场
当AI逐渐褪去神秘面纱,谁是这场技术变革真正的操盘手?答案是:一线业务人。 近日,首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官
2025-12-02 15:58:00
中新经纬12月2日电 题:即时零售不再打“补贴战”了作者 江瀚 盘古智库高级研究员随着资本耐心减弱,单纯依赖补贴拉动的增长已难以为继
2025-12-02 16:09:00
从二维到三维 从升级到迭代 海底鹰打造水下定点三维成像“新质生产力”
近期,一款具备“定点扫测”功能的国产化三维图像声呐,凭借细腻的图像和独有的成像方式,成为声呐应用领域的“新质生产力”。国产三维搜索声呐破局者“HDY-3DL”来自海底鹰深海科技的三维搜索声呐HDY-3DL
2025-12-02 16:13:00
数字赋能,科技兴农——烟职师生赴烟多地开展校企合作调研
近日,为深化产教融合,推动科技兴农战略落地,烟台职业学院经贸系师生团队一行6人赴烟台栖霞、牟平、高新等地的多家农产品加工企业开展实地调研与合作洽谈
2025-12-02 16:16:00