• 我的订阅
  • 科技

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

类别:科技 发布时间:2024-12-21 09:27:00 来源:IT之家

IT之家 12 月 20 日消息,Meta 公司携手华盛顿大学和卡内基梅隆大学,组建科研团队,合作开发了 ExploreToM 框架,旨在更有效地评估和训练大语言模型(LLM)的心智理论(Theory of Mind,ToM)能力。

心智理论

心智理论(Theory of Mind,ToM)是人类社会智能的基础之一,能让我们能够理解他人的想法、意图和信念。这种认知能力对于有效的沟通和协作至关重要,是复杂社交互动的支柱。

让 AI 也具备 ToM 能力,对于创建能与人类无缝互动的智能体至关重要,只是当前大型语言模型(LLM)在 ToM 方面仍面临巨大挑战。

现有的基准通常缺乏复杂性和多样性,导致高估模型能力。例如,许多基准测试基于简单的预定义场景,无法复制人类用来推断心理状态的复杂推理。

ExploreToM 框架

ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于弥合这些差距的潜力。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

在数据集方面,ExploreToM 利用 A* 搜索算法和特定领域语言生成多样化、高难度的测试数据集,模拟复杂的社会情景,挑战 LLM 的认知极限。

ExploreToM 与现有基准测试不同,通过创建对抗性故事场景,旨在揭示 LLM 在 ToM 推理中的盲点。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

此外该框架还引入了非对称信念更新机制,可以模拟不同角色对同一情况持有不同观点的复杂社交互动。

主流模型测试效果

GPT-4o 和 Llama-3.1-70B 模型在 ExploreToM 数据集上的准确率分别只有 9% 和 0%,凸显了现有 LLM 在处理复杂 ToM 推理方面的不足。

在 ExploreToM 数据上进行微调后,模型在经典 ToMi 基准测试中的准确率提高了 27 个百分点,证明了该框架的有效性。

AI 的“心智理论”难题:Meta ExploreToM 探索突破之路

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-21 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

专访上海智绘品牌创始人蔡华虎:营销就是智绘心智
...辑、审校,后担任责编、选题策划一职。从而走上了策划之路。2009年加入中国移动通信联合会,驻点上海移动总部,先后服务上海移动数据部、客服服务中心、综合部,负责互动营销、市场调
2025-10-09 15:20:00
chatgpt背后模型被证实具有人类心智
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上
2023-02-12 23:46:00
从产品出圈到短剧营销:骆驼用一双丑萌鞋打出品牌与销量的双重突围
从#丑萌go野快闪店落地,看头部户外品牌的年轻化破局之路3月8日,骆驼「丑萌go野」主题快闪店于广州骆驼户外运动城(白云新城店)正式揭幕,品牌鞋服挚友、短剧顶流CP李柯以、王培延
2026-03-19 17:12:00
如何统一自然界四种基本作用力,是当今科学界面对的最大难题!
...无定论。至于引力,则更显得毫无头绪,还有漫长的探索之路。因此,说三种力已统一是不准确的。在人类早期,世界被简单地看作由金木水火土构成(东方观点)或由水、火、土、气组成(希腊观
2024-10-28 11:05:00
...》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。心智理论对
2024-05-23 02:36:00
人工智能助力科学发现之路
...自:人民日报海外版从工具到伙伴人工智能助力科学发现之路本报记者 刘 峣AI制图随着人工智能应用的日益广泛,人工智能赋能科学研究(AI for Science)近年来在全球迎来
2025-04-10 03:46:00
chatgpt版必应发飙,怒斥人类:放尊重些
...:额……这不就是我有时候的表现么……被证实具有人类心智其实对于网友们惊叹“太像人”这一点,斯坦福的一项研究早已对此做了证明
2023-02-15 14:56:00
济南大学教授胡晓农:探寻地下水的奥秘
...索的科研之旅从普渡大学到济南大学,胡晓农教授的科研之路跨越了半个地球。1996年,胡晓农教授在普渡大学获得博士学位,随后在美国佛罗里达州立大学担任终身教授,并成为喀斯特研究中
2024-10-14 11:39:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家
2023-04-14 12:00:00
更多关于科技的资讯:
探访2026国际乡村发展创新博览会:“黑科技”绘就现代农业新图景
大皖新闻讯 当“面朝黄土背朝天”成为历史,当“靠天吃饭”逐渐远去,如今的乡村田野正被科技力量重新定义。4月9日,在合肥开幕的2026国际乡村发展创新博览会上
2026-04-09 16:08:00
中国平安二度摘得“中国智能科学技术最高奖”平安科技联合哈工大(深圳)、北大荣获2025年度吴文俊人工智能科技进步奖一等奖
近日,由平安科技联合哈尔滨工业大学(深圳)、北京大学共同完成的《复杂场景非完全信息高效智能决策关键技术及应用》项目,凭借在博弈决策关键技术创新与在金融
2026-04-09 16:16:00
“承三十而立,启山海新程”:山东三联&方太2026战略会暨新品发布会圆满收官
鲁网4月9日讯4月8日,“承三十而立,启山海新程”山东三联&方太2026年战略会暨新品发布会在潍坊盛大启幕。山东三联家用电器有限公司与方太集团的高层领导
2026-04-09 16:16:00
继格林尼治首发后,海尔Horizon冰箱面向英国客户发布
当地时间3月31日,海尔智家在英国利物浦安菲尔德举办客户大会,全球旗舰款Horizon系列冰箱继17日在格林尼治皇家天文台发布后
2026-04-09 16:17:00
全球首发创新产品彰显廊坊“智造”实力
图为在临空经济区(廊坊)的伏羲九针智能科技(北京)有限公司,工作人员正在向国外客户展示技术。(资料片)图片由企业提供近日
2026-04-09 16:21:00
120亿元电影票房见证影市生机勃发,2.96亿人次在假期跨越山海,1.5亿亩春灌沃野润泽良田……当这些跃动的数字汇聚成春日里的发展交响
2026-04-09 17:04:00
一季度厦门贸易行业招聘需求最大驾驶员、行政、仓储、文员等职位竞争激烈东南网4月9日讯(海峡导报记者 钱玲玲) 今年第一季度
2026-04-09 11:16:00
前不久,我国首个机器人保洁员在深圳正式“上岗”,具身智能技术首次走进普通人家庭,面向大众用户开放服务。除此之外,北京经开区养老驿站还配备40余款机器人
2026-04-09 11:27:00
在过去,如果你接到一个AI电话,大概率会在一句“您好,这里是……”之后直接挂断。因为那些机械的复读、刻意的停顿以及那句万能的“我没听懂您再说一遍”
2026-04-09 08:52:00
“经验教学”到“数据治学”:《自然》Nature Index特刊揭秘天立启鸣AI研究院以复杂系统为理论基础的“天立学科大脑”
近日,国际顶级学术出版机构《自然》(Nature)Index China 特刊发布了《AI 模型为偏远地区带来个性化学习》《AI 如何实现更公平的教育》两篇文章
2026-04-09 08:52:00
模数OPC社区在北京经开区启航
本报讯(记者 李佳)昨日,在北京经济技术开发区举办的AIFUTURE北京亦庄AI未来大会上,一个全新的AI创业孵化空间——模数OPC(OnePersonCompany
2026-04-09 10:23:00
厦门四家企业产品 获省内首台(套)认定东南网4月9日讯(海峡导报记者 陈磊)日前,福建省首台(套)重大技术装备认定名单公布
2026-04-09 10:35:00
全球700多家品牌企业参展2026厦门工博会 今天开幕东南网4月9日讯(海峡导报记者 陈磊 黄奕琳) 今日,2026厦门工业博览会暨第30届海峡两岸机械电子商品交易会(以下简称“厦门工博会”)在厦门国际博览中心拉开帷幕
2026-04-09 10:43:00
新茶饮“六小龙”年报成绩单出炉,你喝哪一个?
奈雪掉队、蜜雪领跑、霸王失速、古茗成黑马 沪上阿姨和茶百道中位承压截至本周,新茶饮“六小龙”2025年年报已全部披露完毕
2026-04-09 08:28:00
查运价、追货物一键搞定每日商报讯 对于外贸企业而言,全球航运环境复杂多变、物流信息查询繁琐、运营成本居高不下,一直是制约发展的痛点
2026-04-09 07:27:00