• 我的订阅
  • 科技

AI心理推断能力或与人类相当

类别:科技 发布时间:2024-05-23 02:36:00 来源:每日看点快看

本文转自:科技日报

AI心理推断能力或与人类相当

但不意味着它们有像人那样的情商

科技日报北京5月22日电 (记者张梦然)新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。

心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,LLM这类人工智能(AI)可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚LLM在心智理论任务(被认为是人类独有的能力)中的表现是否也能比肩人类。

此次,德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现,GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。研究人员指出,LLaMA2的成功是因为回答的偏见程度较低,而不是因为真的对失礼敏感;GPT看起来的失利,其实是因为对坚持结论的超保守态度,而不是因为推理错误。

研究团队认为,LLM在心智理论任务上的表现堪比人类,不等于它们具有人类般的“情商”,也不意味着它们能掌握心智理论。但他们也指出,这些结果是未来研究的重要基础,并建议进一步研究LLM在心理推断上的表现,以及这些表现会如何影响人类在人机交互中的认知。

【总编辑圈点】

情商,就是情绪智力,主要是指人在情绪、情感、意志、耐受挫折等方面的品质。有时候,我们不知道如何回复上司的一句“辛苦了”,亲戚的一句“你这工作能挣多少”,也会求助大模型,希望这凝聚了人类智慧的语言模型能给出一些缓解尴尬或令人愉悦的建议。但大模型有情商吗?大模型可以表现出有情商的样子,但它显然无法揣测人心的幽微之处,也无法体会出所谓话外有话,这些独属于人类社交互动的复杂之处,大模型还需要进一步学习。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-23 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...个蛋糕。」然而,GPT-4V 错误地使用了真实世界的状态来推断女人的想法,这表明 GPT-4V 无法区分信念和真实世界状态
2024-09-12 09:45:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。Kosinski教授依据心智理论相关研究
2023-04-14 12:00:00
...的能力”,也不意味着它们拥有人类的“心智”。解读和推断他人心理状态的能力被称为“心智理论”,这是人类社交互动的核心能力,涉及沟通、共情等。研究人员为大语言模型设置了通常用于评
2024-06-08 05:35:00
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...许多基准测试基于简单的预定义场景,无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化
2024-12-21 09:27:00
...权利展开讨论。三是神经技术对人的心智和思想特征进行推断与干预的伦理界限何在。质言之,通过对大脑电化学活动的检测、记录、分析和干预,脑机接口等神经技术具有神经成像(推断心智特性
2024-02-02 05:43:00
chatgpt背后模型被证实具有人类心智
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上
2023-02-12 23:46:00
成长是一场心智的旅程
本文转自:解放日报成长是一场心智的旅程沈祖新人类在自然与社会之间不断探索。 视觉中国供图《心智社会》 [法]帕斯卡尔·博耶 著殷融 译 中信出版集团 ■沈祖新帕斯卡尔·博耶的《心
2023-07-29 05:54:00
看了这些老外的骚操作 我也觉得应该暂停GPT4
...给出的界定:能够对自己、其他智能体和环境进行广泛的推断;能够根据自身特点创建日常计划并执行,并根据执行结果考虑是否重新部署计划;能够在终端用户改变环境或用自然语言命令它们时做
2023-04-20 10:45:00
chatgpt版必应发飙,怒斥人类:放尊重些
...表示:额……这不就是我有时候的表现么……被证实具有人类心智其实对于网友们惊叹“太像人”这一点,斯坦福的一项研究早已对此做了证明
2023-02-15 14:56:00
更多关于科技的资讯:
作者:菏泽市牡丹区第二十一初级中学 张海山“不放弃任何一个孩子。”这句朴素的教育誓言,在山东省菏泽市牡丹区第二十一初级中学
2025-09-04 18:09:00
家家悦生活港9月5日焕新开业,三重升级打造便民购物新体验
齐鲁晚报·齐鲁壹点 记者 张召旭9月5日,备受关注的家家悦生活港明府城店将以全新面貌正式开业。此次焕新升级聚焦消费者核心需求
2025-09-04 18:32:00
尚普咨询集团:知名宠物食品品牌疯狂小狗荣获尚普咨询系列权威市场地位声明
引言:疯狂小狗自创立以来,始终深耕宠物食品领域,将创新研发与智能制造深度融合,不仅为爱宠提供营养均衡的主粮与零食,更以独创的夹心粮技术重新定义宠物食品标准
2025-09-04 17:33:00
全程支持极客营创新 拟上市的嘉立创助力18项硬件原型完成开发
2025年8月上旬,一场为期5天的硬件创意盛会——2025极客营(首场硬件黑客松)在深圳科创学院成功举办。来自美国、英国
2025-09-04 08:34:00
原钻产量同比降11%+GIA分级升级 天然钻石稀缺性支撑价格体系
2025年上半年,全球钻石市场呈现显著结构性分化。在整体价格下行压力下,大克拉异形钻凭借独特稀缺性展现强劲韧性。6月拉斯维加斯JCK珠宝展高端展区人流如织
2025-09-04 08:39:00
浪潮通信信息亮相2025年南亚东南亚数字合作大会
近日,2025南亚东南亚数字合作大会在泰国召开。本次大会由云南省人民政府和泰国数字经济与社会部联合主办,以“促进区域数字合作
2025-09-04 10:01:00
浪潮通信信息亮相2025算网融合产业发展大会,数据中心产品荣获优秀案例
近日,以“开放、创新、融合、共赢”为主题的2025算网融合产业发展大会在北京召开。会上,浪潮通信信息申报的“浪潮预制模块化数据中心产品”
2025-09-04 10:02:00
中新经纬9月4日电 据路透社报道,法国数据保护机构周三表示,已对Alphabet旗下的Google(谷歌)处以3.25亿欧元(3
2025-09-04 10:04:00
河北新闻网讯(邓学军)近日,中国贸促会正式发布《中国好礼产业促进计划2025—2026年度推荐企业及产品名录》,承德避暑山庄旅游集团有限责任公司精心选送的“朕在凉快”折扇
2025-09-04 10:05:00
国产GEO工具破局者 小陌引擎在济南书写AI创新传奇
近日,在生成式AI重塑全球数字竞争格局的浪潮中,来自济南高新区齐鲁软件园的济南矩阵跃动智能有限公司,凭借自主研发的国内首个攻克大模型搜索优化难题的“小陌GEO对抗引擎”
2025-09-04 10:13:00
集萃智造产业化基地项目开工,开启规模化量产新篇章未来三年力争实现年产近万台智能机器人南报网讯(通讯员芦玲玲记者徐宁)记者昨天从江苏集萃智能制造技术研究所有限公司(以下简称“集萃智造”)获悉
2025-09-04 07:40:00
山东移动日照分公司携手山东鲜醇乳业打造5G智能工厂 全流程赋能乳业生产新标杆
鲁网9月3日讯在数字化浪潮推动传统产业转型升级的背景下,山东移动日照分公司助力山东鲜醇乳业有限公司成功入选《2025年5G工厂名录》
2025-09-03 17:12:00
当晚期肺癌患者仅需支付最低207元、最高千余元的保费,即可通过“穗新保”全额报销高达30万元的质子治疗费用,重燃高质量生活希望时
2025-09-03 17:13:00
山东移动日照分公司:数智转型,打造高端板材涂镀产业新标杆
鲁网9月3日讯日照市昱岚新材料有限公司招商引资项目总投资达 63 亿元,目标打造全国最具竞争力的马口铁生产基地。项目分三期建设
2025-09-03 17:14:00
短视频平台丰富了公众的日常生活,提供了公众所需的各类信息,近年来,越来越多的人通过短视频平台向公众传播医学知识,但这些内容并非全部真实可信
2025-09-03 21:24:00