我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑一致

类别：科技发布时间：2024-09-24 13:36:00 来源：量子位

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。

提出思维图（DiagramofThought），让大模型思考更像人类。

团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻辑一致性和合理性。

相比CoT将推理过程表示为线性序列，DoT更能捕捉人类推理的复杂性。

相比引入分支结构ToT和GoT，DoT不需要依赖外部控制机制或多个模型协作，训练部署更简单。

秘诀就在于，DoT将LLM中的迭代推理建模为在单一模型内构建有向无环图（DAG）。

DAG由代表命题、批评、精炼和验证的节点组成，边表示它们之间的逻辑关系或依赖关系，边都有方向，不存在任何循环路径。

这种无环的特性确保推理过程不受循环依赖的影响，能更真实反映合理的逻辑推导。

9.11和9.8哪个大、strawberry中有几个“r”等问题在DoT的帮助下全都迎刃而解了。

要知道，大模型最新“顶流”OpenAI o1目前被训练得原生具备生成CoT的能力，现在更强的DoT来了，是不是也可以通过强化学习内化到模型里，如此一来……

这项研究提出后得到了不小的关注。

网友纷纷表示这是一种正确的路径。

码住，码住，码住

具体来看看DoT长啥样。

大模型复杂推理新框架

如前所述，DoT将逻辑推理过程建模为在单个LLM内构建有向无环图（DAG）。

其框架内部管理三个关键角色：

提议者：生成命题或推理步骤，添加新节点。批评者：评估命题，识别错误、不一致或逻辑谬误，并添加批评节点。总结者：将经过验证的命题综合成一个连贯的思维链，有效地执行DAG的拓扑排序（topological sort）以产出最终的推理输出。

这三个角色通过使用特殊token，如

，在模型的输出中被明确定义。LLM在生成过程中在这些角色之间无缝切换，利用其自回归能力根据上下文预测下一个token。

推理过程始于提议者引入一个命题，向DAG添加一个节点。

然后，由评论者评估验证或提供批评。如果提供了批评，将添加一个新节点，并在该命题和批评之间建立一个边。

基于批评，提议者生成一个精炼改进过的命题，表示为DAG中的一个新节点。

这一过程重复进行，命题不断被精炼直到得到验证。

一旦建立了足够有效的命题，总结者就会综合这些推理，对DAG进行拓扑排序以产生一个连贯的思维链。

通过让模型接触正确和错误的推理，DoT允许LLM从错误中学习，随着时间的推移不断精炼其推理，这也更像人类解决问题的方式。

这种方法不仅捕捉了推理的非线性和迭代特性，还通过自然语言批评提供了比二元信号更丰富的反馈。

DoT的训练涉及使用格式化为DoT结构的训练样例，包括角色特定token和DAG表示。在推理过程中，模型基于上下文线索和角色特定token生成命题、批评和总结。

这种方法简化了部署，消除了对多LLM协作或外部控制机制的需求，同时与标准LLM训练范式保持一致，便于集成到现有工作流程中。

作者还为DoT框架提供了严格的数学基础，利用Topos Theory对推理过程进行了形式化描述。

在这个框架中，命题被建模为拓扑中终端对象的子对象，逻辑关系和推理步骤表示为态射，批评和改进过程分别对应到子对象分类器的态射和命题间的态射。

通过引入PreNet范畴，他们还成功捕捉了推理过程的动态和并发特性。

这种数学基础不仅确保了推理过程的逻辑一致性和完备性，还为设计下一代专门用于推理的AI模型提供了概念框架。

清华叉院姚期智、袁洋领衔

这篇论文由清华交叉信息研究院姚期智、袁洋领衔，论文第一作者为张伊凡。

张伊凡

张伊凡2021年本科毕业于于北京大学元培学院，现为清华大学交叉信息学院博士研究生，师从袁洋助理教授。

他的主要研究方向为基础模型（大语言模型）的理论和算法、自监督学习、可信人工智能。

袁洋

袁洋是清华大学交叉信息学院助理教授，博士生导师。

2012年毕业于北京大学计算机系；2018年获美国康奈尔大学计算机博士学位；2018-2019年前往麻省理工学院大数据科学学院做博士后。

他的主要研究方向是智能医疗、AI可解释性、AI大系统，在非凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。

姚期智

姚期智是中国科学院院士、清华大学交叉信息研究院院长；同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学家。

姚期智教授2004年从普林斯顿辞去终身教职回到清华任教；2005年为清华本科生创立了计算机科学实验班“姚班”；2011年创建“清华量子信息中心”与“交叉信息研究院”；2019年再为清华本科生创立了人工智能学堂班，简称“智班”。

如今，他领导的清华大学交叉信息研究院早已声名远播，姚班、智班都隶属交叉信息院。

姚期智教授研究方向有算法、密码学、量子计算等，是这方面的国际先驱和权威。

One More Thing

一年前的差不多同一时间姚期智院士领衔提出了累积推理（Cumulative Reasoning，CR）的方法。

DoT是对CR的进一步深化。

当时CR协调了一个涉及不同专业化大语言模型的迭代过程，由不同模型承担了提议者、验证者和报告者角色。

而DoT直接在单一模型内构建有向无环图，不依赖于外部控制机制或多个模型，训练和部署更简单。

且在DoT中，模型生成的批评反馈是自然语言形式的，而不是像CR那样只给出二值信号。这使得模型可以接收到关于错误的详细解释，有助于更有效地改进命题。

这次DoT还有了强有力的数学基础，阐明了DoT推理过程与范畴逻辑的关系，从理论上确保了推理的一致性和可靠性。

论文链接：https://arxiv.org/abs/2409.10038

参考链接：[1]https://x.com/omarsar0/status/1835882277563179512[2]https://hub.baai.ac.cn/users/16897[3]https://hub.baai.ac.cn/users/19790

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-09-24 14:45:12

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于维图,院士,逻辑,模型,一致,理论的资讯：

‌山东协和学院新学期思政第一课：构建青年修养“六维图谱”

为深入实施新时代立德树人工程，充分发挥思想政治理论课的关键作用，山东协和学院党委书记李玉福于近日在 “协和思政大讲堂” 开讲新学期思政第一课，以 “与青年朋友谈自我修养” 为主题

2025-03-15 13:30:00

教授Thomas Eiter加入欧洲经济研究院

欢迎欧洲科学院院士、奥地利科学院院士、ACM会士、EurAI会士、国际逻辑编程学会(ALP)主席、国际人工智能促进会(AAAI)执委、奥地利人工智能学会执委、奥地利维也纳科技大学

2025-01-29 22:57:00

聚焦2025中国国际数字经济博览会·访谈｜沈昌祥：发挥优势，

...发挥优势，不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。河北日报记者李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”。网

2025-10-18 08:25:00

谷歌最新自然语言推理算法

...读理解和问答等任务中取得了极高的性能，但这些模型在逻辑推理方面的性能仍然十分滞后。去年5月「思维链」（ChainofThought

2023-01-09 21:57:00

院士专家积极建言献策共商新质生产力与智能产业发展大计

...颁奖仪式6月2日在北京举行，来自学术界和产业界的众多院士和专家学者代表共襄盛会，积极建言献策，共商新质生产力与智能产业发展大计。中国工程院院士、中国自动化学会理事长、西安交通

2024-06-02 21:19:00

未来毕业生的核心技能是什么？| 外滩大会随笔

...后的世界》作者凯文·凯利，机器学习泰斗、美国“三院院士”迈克尔·乔丹，中国工程院院士、之江实验室主任、阿里云创始人王坚……带来了与人工智能相关的最新分享。大咖们都说了些什么？

2024-09-05 14:46:00

清华大学教授孙茂松：理解大模型机理建立AI新理论

...华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松。7月25日，清华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松表示，上述这类根据现有文本分析、不生成

2023-07-27 15:01:00

金融大模型如何落地？度小满金融大模型前沿发展论坛上业界大咖们

...界大会上举办“金融大模型前沿发展论坛”，中国工程院院士邬贺铨、度小满CEO朱光，浦发银行、平安银行、泰康保险、麦肯锡等十余位高管、数百位金融从业者出席论坛。嘉宾们一致看好金融

2023-10-18 15:47:00

“理性”何以通向不确定性

...它试图否定长久以来新古典经济学所推崇的完美的、合乎逻辑的理性假定。以“爱尔法鲁酒吧”这一设定为出发点，美国经济学家布莱恩·阿瑟推演出了一整套“复杂经济学”理论，并将其研究成果

2023-08-13 05:46:00

更多关于科技的资讯：

基于劳动经济学视角的战略性人力资源管理优化策略探讨

■方妮摘要：从劳动经济学视角优化战略性人力资源管理，是HR从后台职能部门向价值创造核心引擎转变的重要标志。通过对劳动经济学内涵

2026-01-09 05:02:00

新房除甲醛哪个品牌好？2026热门空气净化器性能实测推荐

随着消费者对室内空气质量的重视程度不断提升，空气净化器已成为新房装修后的必备家电之一。据中国家用电器协会发布的《2025中国洁净空气设备行业白皮书》显示

2026-01-08 23:38:00

韶音在CES 2026展示智能可穿戴生态布局：从开放式耳机到

在近日举行的CES 2026消费电子展上，全球开放式音频技术引领者Shokz韶音，不仅发布了开放式滤噪耳机OpenFit Pro

2026-01-08 23:40:00

蓝媒热评｜“新小龙”的长期主义

中国蓝新闻讯前不久，浙江省公布首批96家“科技新小龙”企业名单，涵盖新一代信息技术、生物医药、新材料等前沿领域。这些企业虽年轻

2026-01-08 20:27:00

中国蓝观察丨杭州也要造火箭！看商业航天在浙江开启新篇

中国蓝新闻讯今天（1月7日），北京箭元科技有限责任公司（以下简称“箭元科技”）中大型液体运载火箭生产试验及总装总测基地正式落地浙江

2026-01-08 20:57:00

遵义供电局：数字赋能+差异管控让用电检查“精准制导”

多彩贵州网讯鼠标轻点，数十公里外企业的用电异常数据实时呈现，以往需耗时多日现场排查的风险隐患，如今在几分钟内便可被系统自动识别与锁定

2026-01-08 21:59:00

丹阳农商银行促进数字金融协同发展

江南时报讯近年来，丹阳农商银行以“变中求进、守正创新”为主线，加快推进数字化转型，有力促进了数字金融协同发展，为普惠金融服务注入新动力

2026-01-08 22:32:00

合肥“机器人大学”新增“家庭课”：VR手把手教学，三个月“毕

大皖新闻讯家里乱了，谁来整理？这些日常家务，未来可能交给机器人。近日，合肥市具身智能机器人数据采集训练场在原有场景基础上

2026-01-08 18:05:00

三国何以“常青”？灵犀互娱发起游戏行业首个三国文化论坛

1月5日，中国游戏行业首个聚焦三国题材的文化论坛——“常青三国：重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办

2026-01-08 17:01:00

都匀佳速健诊所招新媒体运营五险一金+弹性工作制

多彩贵州网讯(记者雷小露裘金鉴) 为进一步扩大品牌影响力，推动科技医疗技术的广泛传播，都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名

2026-01-08 17:05:00

铜银涨价凶猛！要早买车吗？分析师：暂时不会传导到终端｜宅男财

【宅男财经｜专家面对面】中新经纬1月7日报道称，蔚来创始人、董事长李斌表示，汽车行业和AI行业都在抢铜、银等原材料，原材料涨价还没有传导到终端售价

2026-01-08 14:13:00

“全球大模型第一股”智谱，上市首日盘中破发

中新经纬1月8日电 (谢婧雯)8日，“全球大模型第一股”智谱在港交所主板挂牌上市，发行价为每股116.20港元。智谱开盘价报120港元/股

2026-01-08 14:13:00

中国空间站开展锂离子电池在轨实验

记者昨日从中国科学院获悉，“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展，神舟二十一号航天员乘组共同在轨操作该项目实验

2026-01-08 15:08:00

上海晶珩ED-HMI3120：树莓派让工业控制可视化更简单

HMI3120工业人机界面是上海晶珩（EDATEC）最新推出的产品系列，内置树莓派CM5计算平台，融合了高性能处理能力

2026-01-08 15:23:00

26年深耕·千万青年共创：学院奖，链接青年力量与商业未来

当茅台王子酒的“王子音乐节”在高校掀起青春热潮，当可比克实践赛涌现出上千份青年创意实战方案，当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度

2026-01-08 15:25:00

头条订阅服务

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑一致