• 我的订阅
  • 科技

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

类别:科技 发布时间:2024-12-21 09:27:00 来源:IT之家

IT之家 12 月 20 日消息,Meta 公司携手华盛顿大学和卡内基梅隆大学,组建科研团队,合作开发了 ExploreToM 框架,旨在更有效地评估和训练大语言模型(LLM)的心智理论(Theory of Mind,ToM)能力。

心智理论

心智理论(Theory of Mind,ToM)是人类社会智能的基础之一,能让我们能够理解他人的想法、意图和信念。这种认知能力对于有效的沟通和协作至关重要,是复杂社交互动的支柱。

让 AI 也具备 ToM 能力,对于创建能与人类无缝互动的智能体至关重要,只是当前大型语言模型(LLM)在 ToM 方面仍面临巨大挑战。

现有的基准通常缺乏复杂性和多样性,导致高估模型能力。例如,许多基准测试基于简单的预定义场景,无法复制人类用来推断心理状态的复杂推理。

ExploreToM 框架

ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于弥合这些差距的潜力。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

在数据集方面,ExploreToM 利用 A* 搜索算法和特定领域语言生成多样化、高难度的测试数据集,模拟复杂的社会情景,挑战 LLM 的认知极限。

ExploreToM 与现有基准测试不同,通过创建对抗性故事场景,旨在揭示 LLM 在 ToM 推理中的盲点。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

此外该框架还引入了非对称信念更新机制,可以模拟不同角色对同一情况持有不同观点的复杂社交互动。

主流模型测试效果

GPT-4o 和 Llama-3.1-70B 模型在 ExploreToM 数据集上的准确率分别只有 9% 和 0%,凸显了现有 LLM 在处理复杂 ToM 推理方面的不足。

在 ExploreToM 数据上进行微调后,模型在经典 ToMi 基准测试中的准确率提高了 27 个百分点,证明了该框架的有效性。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-21 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

如何统一自然界四种基本作用力,是当今科学界面对的最大难题!
...无定论。至于引力,则更显得毫无头绪,还有漫长的探索之路。因此,说三种力已统一是不准确的。在人类早期,世界被简单地看作由金木水火土构成(东方观点)或由水、火、土、气组成(希腊观
2024-10-28 11:05:00
chatgpt背后模型被证实具有人类心智
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上
2023-02-12 23:46:00
人工智能助力科学发现之路
...自:人民日报海外版从工具到伙伴人工智能助力科学发现之路本报记者 刘 峣AI制图随着人工智能应用的日益广泛,人工智能赋能科学研究(AI for Science)近年来在全球迎来
2025-04-10 03:46:00
...》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。心智理论对
2024-05-23 02:36:00
chatgpt版必应发飙,怒斥人类:放尊重些
...:额……这不就是我有时候的表现么……被证实具有人类心智其实对于网友们惊叹“太像人”这一点,斯坦福的一项研究早已对此做了证明
2023-02-15 14:56:00
济南大学教授胡晓农:探寻地下水的奥秘
...索的科研之旅从普渡大学到济南大学,胡晓农教授的科研之路跨越了半个地球。1996年,胡晓农教授在普渡大学获得博士学位,随后在美国佛罗里达州立大学担任终身教授,并成为喀斯特研究中
2024-10-14 11:39:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家
2023-04-14 12:00:00
烟台黄渤海新区深化文明实践AI工作室应用场景 专家走进两个社区“智”解民生难题
...既成为基层减负的“数字助手”,更化作服务群众的“暖心智库”,持续为新时代文明实践注入创新动能。
2025-03-31 11:00:00
...“定位方程”的核心在于解构消费者、企业家和管理者的心智,实现战略、战役和战术的协同统一。在消费者心智方面,“定位方程”强调深入洞察消费者的需求、偏好、价值观和购买行为等,挖掘
2025-02-26 15:35:00
更多关于科技的资讯:
投洽会期间厦门火炬高新区共有41个项目完成签约 计划总投资约433亿元
投洽会上,火炬高新区企业展示的芯片产品吸引客商关注。(本组图/厦门日报全媒体记者 卢剑豪 摄)多家位于火炬高新区的专精特新“小巨人”企业亮相投洽会
2025-09-09 08:44:00
刚刚过去的暑假,“工厂游”火爆出圈。多地工厂纷纷敞开大门,推出丰富多彩的研学项目。而在社交平台上,“工厂游”的攻略被大量转发
2025-09-09 08:46:00
东南网9月8日讯(通讯员 苏培婷)9月5日,由大田县总工会、国网大田县供电公司联合主办,国网大田县供电公司工会承办的首届“电力工匠”职业技能竞赛AI技术应用项目比赛圆满落幕
2025-09-09 09:28:00
本报讯 作为中国洗涤用品工业协会主办的行业盛会,第45届(2025)中国洗涤用品行业年会与第17届中国国际日化产品原料及设备包装展览会(以下简称“中国国际日化展”)将于今年10月15日至17日在重庆国际博览中心举行
2025-09-09 10:44:00
摩登中国时尚展传递中国皮革强音
本报记者 解 磊 文/摄为了满足人们对鞋包服饰等消费需求,为国际国内品牌企业、特色区域、独立设计师提供一个高端商贸合作
2025-09-09 10:44:00
近年来,我国消费市场涌现出许多新亮点,其中一个令人意外却极具代表性的现象是:碳纤维最大应用市场,竟然不是航空航天或风电叶片
2025-09-09 10:45:00
获SIAL创新金奖:纸沙拉沙拉脆片掀起零食健康新主张
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。湖南立方体食品有限公司选送的产品纸沙拉沙拉脆片荣获金奖
2025-09-09 11:17:00
王腾发微博辟谣:有失职,但没有窃取机密出售
9月8日,王腾发布离开小米的微博,当天,“小米王腾因泄密被辞退”登上热搜。此前,2023年8月25日,王化曾发博表示,欢迎王腾回京~好好干
2025-09-09 11:18:00
王腾深夜发文离开小米,其曾被赠“谨言慎行”T恤
9月8日晚,中国区市场部总经理、REDMI品牌总经理王腾发布微博:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价
2025-09-09 11:18:00
前零一万物联创戴宗宏创业:20人团队,能干上百人的AI定制项目
文|周鑫雨编辑|苏建勋国内市场、ToB、定制化——每个词都踩到了当下AI创业的雷点上。但这恰恰是前零一万物联合创始人戴宗宏
2025-09-09 15:19:00
不再低调的二次元,正在经营一种「痛系生活」
撰文|深海 封面来源|视觉中国 刚刚过去的这个夏天,上海俨然变成了一座二次元年轻人的“痛城”。 7月开始,几大动漫展会接连袭来
2025-09-09 21:51:00
全棉时代官宣孙颖莎为全球品牌代言人
9月8日,全棉时代官宣乒乓球运动员孙颖莎为全球品牌代言人,为旗下棉柔巾品类代言。双方将携手传递舒适、健康、环保的全棉生活方式
2025-09-09 14:30:00
京东超市11周年发布新战略 未来三年用户数从3亿将增至5亿
京东超市11周年发布会8日在北京举行,全球快消行业超400家知名品牌负责人、高管齐聚一堂。面对全球零售业遇到的多重挑战
2025-09-09 15:02:00
中秋至味 团圆共飨|好太太2025中秋礼盒上线啦!
月满人间,礼寄相思好太太中秋诚挚献礼好太太中秋礼盒是家的味道,更是爱的传递礼盒产品线下各大商超均有售卖欢迎各企事业单位
2025-09-09 15:19:00
让每个临沂人吃上48小时的健康好蛋 ——雁行天下商务驿站“斗蛋”比赛活动
大众网记者葛世艳 临沂报道9月2日上午,雁行天下全景溯源工厂体验店高朋满座,一场围绕新鲜健康好蛋的“斗蛋”活动在此热闹展开
2025-09-09 15:29:00