• 我的订阅
  • 科技

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

类别:科技 发布时间:2024-09-24 13:36:00 来源:量子位

姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。

提出思维图(DiagramofThought),让大模型思考更像人类。

团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻辑一致性和合理性。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

相比CoT将推理过程表示为线性序列,DoT更能捕捉人类推理的复杂性。

相比引入分支结构ToT和GoT,DoT不需要依赖外部控制机制或多个模型协作,训练部署更简单。

秘诀就在于,DoT将LLM中的迭代推理建模为在单一模型内构建有向无环图(DAG)。

DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

这种无环的特性确保推理过程不受循环依赖的影响,能更真实反映合理的逻辑推导。

9.11和9.8哪个大、strawberry中有几个“r”等问题在DoT的帮助下全都迎刃而解了。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

要知道,大模型最新“顶流”OpenAI o1目前被训练得原生具备生成CoT的能力,现在更强的DoT来了,是不是也可以通过强化学习内化到模型里,如此一来……

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

这项研究提出后得到了不小的关注。

网友纷纷表示这是一种正确的路径。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

码住,码住,码住

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

具体来看看DoT长啥样。

大模型复杂推理新框架

如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。

其框架内部管理三个关键角色:

提议者:生成命题或推理步骤,添加新节点。 批评者:评估命题,识别错误、不一致或逻辑谬误,并添加批评节点。 总结者:将经过验证的命题综合成一个连贯的思维链,有效地执行DAG的拓扑排序(topological sort)以产出最终的推理输出。

这三个角色通过使用特殊token,如

,在模型的输出中被明确定义。LLM在生成过程中在这些角色之间无缝切换,利用其自回归能力根据上下文预测下一个token。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

推理过程始于提议者引入一个命题,向DAG添加一个节点。

然后,由评论者评估验证或提供批评。如果提供了批评,将添加一个新节点,并在该命题和批评之间建立一个边。

基于批评,提议者生成一个精炼改进过的命题,表示为DAG中的一个新节点。

这一过程重复进行,命题不断被精炼直到得到验证。

一旦建立了足够有效的命题,总结者就会综合这些推理,对DAG进行拓扑排序以产生一个连贯的思维链。

通过让模型接触正确和错误的推理,DoT允许LLM从错误中学习,随着时间的推移不断精炼其推理,这也更像人类解决问题的方式。

这种方法不仅捕捉了推理的非线性和迭代特性,还通过自然语言批评提供了比二元信号更丰富的反馈。

DoT的训练涉及使用格式化为DoT结构的训练样例,包括角色特定token和DAG表示。在推理过程中,模型基于上下文线索和角色特定token生成命题、批评和总结。

这种方法简化了部署,消除了对多LLM协作或外部控制机制的需求,同时与标准LLM训练范式保持一致,便于集成到现有工作流程中。

作者还为DoT框架提供了严格的数学基础,利用Topos Theory对推理过程进行了形式化描述。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

在这个框架中,命题被建模为拓扑中终端对象的子对象,逻辑关系和推理步骤表示为态射,批评和改进过程分别对应到子对象分类器的态射和命题间的态射。

通过引入PreNet范畴,他们还成功捕捉了推理过程的动态和并发特性。

这种数学基础不仅确保了推理过程的逻辑一致性和完备性,还为设计下一代专门用于推理的AI模型提供了概念框架。

清华叉院姚期智、袁洋领衔

这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。

张伊凡

张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学交叉信息学院博士研究生,师从袁洋助理教授。

他的主要研究方向为基础模型(大语言模型)的理论和算法、自监督学习、可信人工智能。

袁洋

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

袁洋是清华大学交叉信息学院助理教授,博士生导师。

2012年毕业于北京大学计算机系;2018年获美国康奈尔大学计算机博士学位;2018-2019年前往麻省理工学院大数据科学学院做博士后。

他的主要研究方向是智能医疗、AI可解释性、AI大系统,在非凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。

姚期智

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

姚期智是中国科学院院士、清华大学交叉信息研究院院长;同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学家。

姚期智教授2004年从普林斯顿辞去终身教职回到清华任教;2005年为清华本科生创立了计算机科学实验班“姚班”;2011年创建“清华量子信息中心”与“交叉信息研究院”;2019年再为清华本科生创立了人工智能学堂班,简称“智班”。

如今,他领导的清华大学交叉信息研究院早已声名远播,姚班、智班都隶属交叉信息院。

姚期智教授研究方向有算法、密码学、量子计算等,是这方面的国际先驱和权威。

One More Thing

一年前的差不多同一时间姚期智院士领衔提出了累积推理(Cumulative Reasoning,CR)的方法。

DoT是对CR的进一步深化。

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致

当时CR协调了一个涉及不同专业化大语言模型的迭代过程,由不同模型承担了提议者、验证者和报告者角色。

而DoT直接在单一模型内构建有向无环图,不依赖于外部控制机制或多个模型,训练和部署更简单。

且在DoT中,模型生成的批评反馈是自然语言形式的,而不是像CR那样只给出二值信号。这使得模型可以接收到关于错误的详细解释,有助于更有效地改进命题。

这次DoT还有了强有力的数学基础,阐明了DoT推理过程与范畴逻辑的关系,从理论上确保了推理的一致性和可靠性。

论文链接:https://arxiv.org/abs/2409.10038

参考链接:[1]https://x.com/omarsar0/status/1835882277563179512[2]https://hub.baai.ac.cn/users/16897[3]https://hub.baai.ac.cn/users/19790

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-24 14:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

‌山东协和学院新学期思政第一课:构建青年修养“六维图谱”
为深入实施新时代立德树人工程,充分发挥思想政治理论课的关键作用,山东协和学院党委书记李玉福于近日在 “协和思政大讲堂” 开讲新学期思政第一课,以 “与青年朋友谈自我修养” 为主题
2025-03-15 13:30:00
教授Thomas Eiter加入欧洲经济研究院
欢迎欧洲科学院院士、奥地利科学院院士、ACM会士、EurAI会士、国际逻辑编程学会(ALP)主席、国际人工智能促进会(AAAI)执委、奥地利人工智能学会执委、奥地利维也纳科技大学
2025-01-29 22:57:00
谷歌最新自然语言推理算法
...读理解和问答等任务中取得了极高的性能,但这些模型在逻辑推理方面的性能仍然十分滞后。去年5月「思维链」(ChainofThought
2023-01-09 21:57:00
院士专家积极建言献策 共商新质生产力与智能产业发展大计
...颁奖仪式6月2日在北京举行,来自学术界和产业界的众多院士和专家学者代表共襄盛会,积极建言献策,共商新质生产力与智能产业发展大计。中国工程院院士、中国自动化学会理事长、西安交通
2024-06-02 21:19:00
清华大学教授孙茂松:理解大模型机理建立AI新理论
...华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松。7月25日,清华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松表示,上述这类根据现有文本分析、不生成
2023-07-27 15:01:00
未来毕业生的核心技能是什么?| 外滩大会随笔
...后的世界》作者凯文·凯利,机器学习泰斗、美国“三院院士”迈克尔·乔丹,中国工程院院士、之江实验室主任、阿里云创始人王坚……带来了与人工智能相关的最新分享。大咖们都说了些什么?
2024-09-05 14:46:00
金融大模型如何落地?度小满金融大模型前沿发展论坛上业界大咖们这样说
...界大会上举办“金融大模型前沿发展论坛”,中国工程院院士邬贺铨、度小满CEO朱光,浦发银行、平安银行、泰康保险、麦肯锡等十余位高管、数百位金融从业者出席论坛。嘉宾们一致看好金融
2023-10-18 15:47:00
“理性”何以通向不确定性
...它试图否定长久以来新古典经济学所推崇的完美的、合乎逻辑的理性假定。以“爱尔法鲁酒吧”这一设定为出发点,美国经济学家布莱恩·阿瑟推演出了一整套“复杂经济学”理论,并将其研究成果
2023-08-13 05:46:00
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...智能(AGI)和科学智能的发展判断。参与此次论坛的两院院士、国内外知名科学家也认为,AI必须具备超越简单数据处理的能力,结合创造力、探索精神和新的学习机制,推动各学科领域的不
2024-07-08 09:54:00
更多关于科技的资讯:
8月28日,秦皇岛市海港区阿尔勃特空间智能(河北)视觉技术有限公司展示区,公司副总经理朱晓明用语音进行操作,要求机器人“鲁班1号”打好对应工位的螺丝
2025-09-10 08:27:00
第六届中国人工智能大赛在厦启动 描绘“数实融合”新图景
扫码了解详情厦门网讯(厦门日报全媒体记者 翁华鸿)在生成式人工智能持续迭代演进、与实体经济深度融合的背景下,一场高规格的人工智能盛会再度在厦门启航
2025-09-10 08:27:00
上海人工智能实验室主任、首席科学家周伯文:“人工智能+供应链”创新成果将在厦涌现
周伯文。(厦门日报全媒体记者 王火炎 摄)厦门正在全力推进国家人工智能应用中试基地建设,一批“人工智能+供应链”的创新成果有望在此加速涌现
2025-09-10 08:58:00
随着中报陆续披露,在今年国内医疗器械行业普遍承压的大环境下,鱼跃医疗交出了一份营收、净利双增的亮眼答卷,其中海外业务同比增长26
2025-09-10 09:17:00
上海时尚之都的形象深入人心,时装之外,上海还是一座美妆之城。今年8月,胡润研究院发布《2025 CBE·胡润中国彩妆品牌TOP50》报告
2025-09-10 10:55:00
当消费市场从规模竞赛转向价值深耕时,一场以民生需求为罗盘的产业变革正加速演进。国家统计局日前发布的数据显示,今年1—7月
2025-09-10 10:55:00
青岛锐智智能装备科技股份有限公司:科技创新引领高质量发展
鲁网9月10日讯(记者 葛万彩)在国际国内市场竞争异常激烈的形势下,青岛锐智智能装备科技股份有限公司靠科技人员自主研发
2025-09-10 11:20:00
AirPods Pro 3 登场了!耳机支持测心率,实时翻译功能国行暂不支持
在今日凌晨举行的“前方超燃”苹果发布会上,AirPods Pro 3正式亮相。这款耳机不仅延续了苹果经典的简约设计和出色音质
2025-09-10 11:24:00
重大变革!iPhone17将仅支持eSIM,不再配备实体卡槽,苹果官网默默下架iPhone16pro
9月10日,在凌晨举行的苹果2025秋季新品发布会上,苹果宣布,“史上最薄”iPhone Air 将在全球范围内统一采用仅支持eSIM的设计
2025-09-10 11:24:00
大众网记者 徐浩 通讯员 李琛 潍坊报道近年来,随着大数据、云计算、人工智能等技术的快速发展,保险行业数字化转型步伐持续加快
2025-09-10 11:49:00
高端成效凸显!深圳首家卡萨帝体验中心开业,套购占比超6成
下半年以来,伴随卡萨帝高端化战略布局的持续深化,全国城市体验中心加速落地,战略成效进一步凸显。8月31日,位于深圳市福田区的深圳首家卡萨帝城市体验中心正式开业
2025-09-10 14:14:00
加加酱油七年减盐路引领行业革新,净利润跃升129%书写转型典范
今日,记者从宁乡市获悉,当中国调味品行业仍在价格战的泥潭中挣扎时,加加食品(002650.SZ)用一份亮眼的半年报,为行业开辟出一条价值增长的新路径
2025-09-10 14:16:00
“佳直播”携手爱奇艺打造明星感4K超高清直播间,助力内容电商激活商业价值
2024年,我国直播电商市场规模已达5.8万亿元,用户规模突破5.97亿,业态早已从实物商品销售扩展至本地生活服务、虚拟内容付费等多元领域
2025-09-10 14:17:00
掌阅科技17周年庆,全面布局多元内容,探索数字化创新新机遇
2025年,掌阅科技迎来成立17周年,正式发布全新使命“让创作点亮美好时光”,同时启用全新Slogan“悦享美好时光”
2025-09-10 14:18:00
中新经纬9月10日电 据中国移动官网消息,10日中国移动发布《关于部分国际漫游套餐产品更新调整的公告》称,自2025年9月16日0时起
2025-09-10 14:41:00