• 我的订阅
  • 头条热搜
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...本质的不同。其不仅进入到复杂的领域,还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
倒计时10天!百度世界2023五大亮点全剧透
...以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生产中扮...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...短两个月,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。据了解,“日日新5.5”模型训练是基于超10TB tokens高质量数据,包括大量合成的思维...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...规模较小,仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的任务和领域,并展示新颖的功能。我们还探讨了模型的推理能力和思维链机制的在图像生成领域的潜在应用。Paper: https://arxiv.org/pdf/2409.11340 Code: https://github.com/VectorSpaceLab/OmniGen Demo: https://huggingface……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
生成式AI收入增超2.5倍!商汤上半年减亏两成,总算力突破两万P
...务的强劲需求、“日日新”大模型能力的飞跃式提升以及推理成本的快速下降,模型调用量增长迅速。今年以来,商汤先后发布了日日新大模型的5.0及5.5两大版本,多模态能力全面加强,实时交互体验对标GPT-4o,同时还推出了云...……更多
把AI视为人?错了!DeepMind研究科学家:“模型即计算机”才是未来新范式
...何利用它进行有用的工作?我们用什么隐喻(metaphor)来推理它?第一个方向受到广泛关注和大量投资,这是有道理的:技术能力的进步是一切可能应用的基础。但是,第二个方向对该领域同样至关重要,而且存在着巨大的未知...……更多
更多关于科技的资讯:
每日商报讯 一群小朋友在教练的带领下,灵活地穿梭在篮球场上。运球、传球、投篮……一气呵成的动作让人目不暇接。富阳银湖体育中心最近成了不少市民游玩的新地方
2025-03-12 07:43:00
全球首例 杭州企业让灯光像自然光一样流淌
杭科光电的智能灯 余杭区融媒体中心供图近日,在余杭区闲林街道的一间实验室里,工程师们反复调整着一根柔性灯丝。当电流通过时
2025-03-12 08:14:00
反超美国!上海“人造太阳”创下高温超导D形磁体最高磁场纪录
快科技3月12日消息,据报道,近日,上海核聚变能源商业公司“能量奇点”宣布,其自主研制的大孔径强场磁体“经天磁体”成功完成首轮通流实验
2025-03-12 08:19:00
全球首款安卓16旗舰!谷歌Pixel 10系列渲染图出炉
快科技3月12日消息,知名爆料人士Onleaks曝光了谷歌Pixel 10系列渲染图,该系列共有三款机型,分别是Pixel 10
2025-03-12 08:19:00
华为手机用户放心 微信绝大部分功能都会上线鸿蒙版
快科技3月12日消息,日前,微信员工“客村小蒋”微博发文,谈到了鸿蒙微信,称理解关于鸿蒙微信某些功能缺失或bug的评论
2025-03-12 08:19:00
厦门网讯(厦门日报记者 陈泥)“只要金价的1/10”“挑战1克金打造40克金手镯”……作为黄金饰品的平替,“金包银”日益受到消费者的青睐
2025-03-12 08:29:00
“富家千金”力捧的Miu Miu,一年卖近百亿
作者: 周嘉宝“穿CHANEL不等于有钱人,穿Miu Miu的才是真千金。”这句火爆全网的流行语,背后藏着中国年轻群体的社交“圈层密码”
2025-03-12 08:41:00
AI不会简单地卷走工作岗位,而是在重塑整个就业生态我们必须朝着“既要人工智能+,也要技能+”方向转型AI浪潮来袭,在兴奋于AI带来技术赋能的同时
2025-03-12 08:44:00
《哪吒2》冲刺150亿票房新纪录:距全球影史票房Top5仅一步之遥
快科技3月12日消息,今日,据灯塔专业版显示,电影《哪吒之魔童闹海》(《哪吒2》)全球票房(含预售及海外)目前已超过149
2025-03-12 08:49:00
近日,《政府工作报告》首次提及培育具身智能产业、大力发展智能机器人。此外,总部位于上海的智元机器人将于3月10日正式发布首个通用具身基座模型—智元启元大模型
2025-03-12 09:16:00
人气旺! WTT重庆冠军赛“引客来”
3月11日,重庆市巴南区华熙LIVE·鱼洞,国际顶级乒乓球赛事WTT重庆冠军赛燃情开赛。大量人流如潮水般涌入,使得周边餐饮
2025-03-12 09:18:00
OpenAI发布全新Agent:内置三大工具
快科技3月12日消息,据报道,OpenAI发布了专为构建AI Agents设计的新工具和API。OpenAI此次发布的核心产品包括Responses API和Agents SDK
2025-03-12 09:19:00
反内卷!多家公司禁用PPT
快科技3月12日消息,在“996”曾成为常态的互联网和制造行业,越来越多公司加入到“反内卷”行动中来。据媒体报道,名创优品集团叶国富要求内部沟通严禁使用PPT
2025-03-12 09:19:00
本文转自:人民网-北京频道人民网北京3月12日电 (记者李博)位于北京中轴线北延长线上的亚奥商圈将加快数字化转型升级,打造智慧商圈
2025-03-12 09:22:00
山东乐陵:数智赋能企业产销两旺
本文转自:人民网-山东频道2025年3月11日,山东省曼德汽车零部件(乐陵)公司的智能车间过道上,连入5G专网的AGV小车
2025-03-12 09:22:00