• 我的订阅
  • 科技

AI心理推断能力或与人类相当

类别:科技 发布时间:2024-05-23 02:36:00 来源:每日看点快看

本文转自:科技日报

AI心理推断能力或与人类相当

但不意味着它们有像人那样的情商

科技日报北京5月22日电 (记者张梦然)新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。

心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,LLM这类人工智能(AI)可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚LLM在心智理论任务(被认为是人类独有的能力)中的表现是否也能比肩人类。

此次,德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现,GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。研究人员指出,LLaMA2的成功是因为回答的偏见程度较低,而不是因为真的对失礼敏感;GPT看起来的失利,其实是因为对坚持结论的超保守态度,而不是因为推理错误。

研究团队认为,LLM在心智理论任务上的表现堪比人类,不等于它们具有人类般的“情商”,也不意味着它们能掌握心智理论。但他们也指出,这些结果是未来研究的重要基础,并建议进一步研究LLM在心理推断上的表现,以及这些表现会如何影响人类在人机交互中的认知。

【总编辑圈点】

情商,就是情绪智力,主要是指人在情绪、情感、意志、耐受挫折等方面的品质。有时候,我们不知道如何回复上司的一句“辛苦了”,亲戚的一句“你这工作能挣多少”,也会求助大模型,希望这凝聚了人类智慧的语言模型能给出一些缓解尴尬或令人愉悦的建议。但大模型有情商吗?大模型可以表现出有情商的样子,但它显然无法揣测人心的幽微之处,也无法体会出所谓话外有话,这些独属于人类社交互动的复杂之处,大模型还需要进一步学习。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-23 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...个蛋糕。」然而,GPT-4V 错误地使用了真实世界的状态来推断女人的想法,这表明 GPT-4V 无法区分信念和真实世界状态
2024-09-12 09:45:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。Kosinski教授依据心智理论相关研究
2023-04-14 12:00:00
...的能力”,也不意味着它们拥有人类的“心智”。解读和推断他人心理状态的能力被称为“心智理论”,这是人类社交互动的核心能力,涉及沟通、共情等。研究人员为大语言模型设置了通常用于评
2024-06-08 05:35:00
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...许多基准测试基于简单的预定义场景,无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化
2024-12-21 09:27:00
...权利展开讨论。三是神经技术对人的心智和思想特征进行推断与干预的伦理界限何在。质言之,通过对大脑电化学活动的检测、记录、分析和干预,脑机接口等神经技术具有神经成像(推断心智特性
2024-02-02 05:43:00
chatgpt背后模型被证实具有人类心智
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上
2023-02-12 23:46:00
成长是一场心智的旅程
本文转自:解放日报成长是一场心智的旅程沈祖新人类在自然与社会之间不断探索。 视觉中国供图《心智社会》 [法]帕斯卡尔·博耶 著殷融 译 中信出版集团 ■沈祖新帕斯卡尔·博耶的《心
2023-07-29 05:54:00
看了这些老外的骚操作 我也觉得应该暂停GPT4
...给出的界定:能够对自己、其他智能体和环境进行广泛的推断;能够根据自身特点创建日常计划并执行,并根据执行结果考虑是否重新部署计划;能够在终端用户改变环境或用自然语言命令它们时做
2023-04-20 10:45:00
chatgpt版必应发飙,怒斥人类:放尊重些
...表示:额……这不就是我有时候的表现么……被证实具有人类心智其实对于网友们惊叹“太像人”这一点,斯坦福的一项研究早已对此做了证明
2023-02-15 14:56:00
更多关于科技的资讯:
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00