推理,模型,内心,人类,世界,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

英伟达公布未来三年芯片路线图，AI工厂有了操作系统；黄仁勋：

...着黄仁勋演讲开始有所走高，但收盘仍跌超3%。代理AI和推理将推动算力增长，数据中心支出将达到1万亿美元在演讲开始，黄仁勋对比了基于Blackwell架构的GeForce 5090芯片和RTX4090的进步。“它体积缩小了30%，能效散热提升30%，性...……更多

2025-03-19 08:13:00英伟,路线图,机器人,芯片,路线,工厂

会见企业家｜周鸿祎：开源才是真正难以逾越的壁垒，中美AI技术

...力，云服务商通过算力需求激增获益，国产芯片厂商则借推理算力优化实现弯道超车，对于英伟达而言，也是好事，英伟达服务器需求随着使用算力的人数增加而增加。“很多人老是津津乐道具体技术细节，但技术并不是别人不...……更多

2025-03-04 09:41:00周鸿,中美,壁垒,企业家,领先,技术

大江东｜在首届浦江AI学术年会，感受人工智能加速跑

...，“我希望通过因果智能研究，让大模型今后拥有强大的推理能力，能够从大数据中发现数据之间的因果关系，这样就能形成新的知识。”“我们正在把大模型和因果推理方法联系起来，让大模型去寻找纷繁复杂世界中的因果关...……更多

2024-12-24 15:57:00浦江,人工智能,大江,年会,人工,首届

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...图像的任意组合作为输入，实时对音频、视觉和文本进行推理，生成相应的输出。相比ChatGPT的文生文、文生图，Sora的文生视频等，GPT-4o是一个原生多模态的融合体。这一点，谷歌的Gemini Astra也能实现，支持多模态的推理。在演...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

世界首款人形机器人模型正式亮相，距离真正进入生活还有多久？

...人的普及，还离不开产业链上游的大模型产业、模型训练推理的基础设施算力产业链的成熟度。从国内来看，人形机器人产业已经驶入快速发展和追赶国际先进技术的阶段。2023年底，为推动人形机器人产业高质量发展，工业和...……更多

2024-03-20 11:29:00人形,机器人,模型,机器,世界,生活

我们用最近很火的DeepSeek挑战了物理所出的竞赛题，结果

近日，我国“深度求索”公司发布的具备深度思考和推理能力的开源大模型 DeepSeek-R1 受到了全世界的关注。在 DeepSeek-R1 之前，美国 OpenAI 公司的 GPT-o1，Athropic 公司的 Claude，Google 公司的 Gemini，都号称具备了深度思考和推理能力..……更多

2025-02-06 15:53:00物理所,竞赛题,竞赛,物理,结果,阅卷

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

OpenAI迄今最大、最贵模型！GPT-4.5正式发布

...题方面发挥更大作用，并且模型的幻觉现象更少，但数学推理能力仍逊于o3-mini等推理模型。GPT-4.5是OpenAI最后一个“非思维链模型”，通过扩大预训练和后训练规模，提升了非监督学习能力，未来将作为推理模型的基础。不过目...……更多

2025-02-28 07:37:00模型,模型,用户,推理,能力,开放

2024北京国际车展｜加速智能汽车驶入AGI时代商汤绝影系

...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力，DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是，前不久上市的小...……更多

2024-04-28 21:29:00商汤,原生态,北京,车展,模型,智能

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

OpenAI发布免费新品GPT-4o：可对音频、视觉和文本实

...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理，接受文本、音频和图像的任何组合作为输入，并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入，平均为320毫秒，这与人类在对话...……更多

2024-05-14 16:45:00本实,和文,推理,新品,音频,对话

ChatGPT一周年，机会在大厂还是小公司？

...。大模型还存在一些不足，包括如何做更高效果的架构、推理加速，训练加速等。如果面向未来智能体的发展，大模型仍然有很多模块欠缺，比如记忆能力、推理能力、规划能力等，包括现在大模型背后的一些机理，都不足以支...……更多

2023-12-07 09:42:00大厂,还是,机会,公司,模型,王小川

谷歌发力世界模型：从OpenAI挖来Sora核心负责人！

...通向通用人工智能（AGI）的关键路径。世界模型将为视觉推理与模拟、代理规划以及实时互动娱乐等多个领域提供强大动力。”据悉，“世界模型”是目前技术流派中难度最高的一种，其特点在于让机器能够像人类一样对真实世...……更多

2025-01-07 18:18:00模型,负责人,核心,世界,模型,布鲁克斯

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

人工智能应用场景不断拓展

...下一代的模型须具备更大规模、更复杂、更多层次的逻辑推理能力，全世界先进模型的投入门槛将达到数十亿、数百亿美元的级别。清华大学人工智能研究院副院长朱军说，大模型的发展一方面要让消费者参与和交互，另一方面...……更多

2024-09-26 04:44:00人工智能,人工,场景,不断,智能,应用

项立刚：硬堆算力遇瓶颈，“内外兼修”才是正道

...不需要什么“万卡集群”，有时一张卡就可以完成训练和推理工作，输出的内容也更准确，效果更好。但也要注意，设计和训练专用大模型依然需要相当专业的知识和经验，包括高水平的设计者、跨学科合作，并通过高效的算法...……更多

2024-12-30 06:40:00正道,瓶颈,模型,模态,万卡,智能

不听人类指挥 OpenAI模型拒绝关闭

...，但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本，旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。美国AI安全机构帕利塞德研究所说，o3破坏关闭机制以...……更多

2025-05-27 08:59:00指挥,模型,人类,指令,美国,模型

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...，从跨模态预训练、到下游任务的微调都可以完成。而在推理端，他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中，可能只需要针对AI模型本身进行推理优化，就能在...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

DeepSeek火爆后，会发生什么

...在缺乏参考的情况下，成功复现媲美 OpenAI o1 模型的深度推理能力，而且应用程序接口（API）价格仅为后者的 1/30；此前DeepSeek V3 模型通过模型架构和基础软硬件的深度集成优化，实现与 GPT-4o 相当模型能力的同时，单次训练成本...……更多

2025-02-27 21:52:00火爆,模型,普惠,智能,能力,人工智能

推动前沿大模型技术应用这只浙股去年营收净利双增

...司利用自主研发的训练框架和量化算法显著提升了训练和推理速度，并优化了模型精度与推理吞吐量；在智能安全保障上，公司采用RLHF方案对齐安全认知，创新的热修复技术确保了大模型的安全性，提供安全、可靠的用户体验...……更多

2025-02-26 09:09:00净利,技术应用,模型,应用,技术,模型

AI泡沫不可避免！李彦宏敲响警钟：PMF是生存关键

...苹果研究员最近发布了一篇名为《理解大语言模型中数学推理局限性》的论文，质疑大语言模型的数学推理能力，甚至认为大语言模型不具备真正的推理能力，放弃造车、战略押注AI的苹果甚至放弃了OpenAI的新一轮投资机会。与...……更多

2024-10-18 09:30:00李彦,警钟,泡沫,关键,模型,泡沫

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型