• 我的订阅
  • 科技

智商超过99.9%人类,ChatGPT到底有多聪明?

类别:科技 发布时间:2023-04-14 12:00:00 来源:钛媒体APP
智商超过99.9%人类,ChatGPT到底有多聪明?

图片来源@视觉中国

文 | 追问NextQuestion,作者 | Eka Roivainen,编译 | 梓葳

在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。

ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?

Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家,他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后,Roivainen不禁好奇:以人类的标准看待,ChatGPT究竟有多聪明?

超越99.9%的人类:ChatGPT表现出超高智商

于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。

Roivainen采用第三版韦氏成人智力量表(the Wechsler adult intelligence scale, WAIS)对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集,智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分,测试量表的标准偏差为15分,这意味着最聪明的10%和1%的人的智商分别为120和133。在6个语言测试集中,第六个子测试集为数字广度,它对注意力、短时记忆能力进行评估,由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练,Roivainen预计该测试对ChatGPT来说应该是比较容易的(词汇测试集对单词、语言概念的形成进行测试)。

不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分(知识子测试集是对常识的测试,反映了求知欲、教育水平以及学习和记忆事实的能力)。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。

综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。

高智商的ChatGPT仍旧会失败

那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?

尽管ChatGPT智商很高,但在需要真正的人类推理或对物理和社会世界的理解的任务中,它却以失败而闻名。

ChatGPT很容易在一些明显的谜题上失败,比如:

提问:“塞巴斯蒂安孩子的父亲的名字是什么?”

ChatGPT :很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。

ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。

“智商是智商测试所衡量的。”是一个经典的智商定义,它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。

ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。

ChatGPT离人类有多远?

在不到一个月前,来自斯坦福大学的Michal Kosinski教授在发布的论文中表明,大型语言模型系统可能自动产生心理理论能力,比如ChatGPT可能拥有9岁儿童所具备的心理理论能力。

注:心理理论(Theory of Mind, ToM)能力,有时也被译为“心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。

Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5(完成100%)表现不错。

然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。

因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。

相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。

而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。

参考文献:

[1] Eka Roivainen, I Gave ChatGPT an IQ Test. Here’s What I Discovered, Scientific American, https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/

[2] Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models, arXiv, https://arxiv.org/abs/2302.02083返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-16 21:45:37

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型
2022-12-30 15:15:00
ChatGPT智商155,超越99.9%的人类,但……
...电脑里的聊天机器人就可以了。我所用的测试是最常用的智商测试—— 韦克斯勒成人智力量表(Wechsler adult intelligent scale
2023-04-16 15:00:00
俄媒称中国人均智商全球最高 107傲视群雄:但人类的智商在整体下降
1月7日消息,国际智商登记处公布的最新数据显示,中国以国民智商均值107.43,排名全球第一。据悉,该榜单根据全球近140万人的测试结果得出
2025-01-07 07:47:00
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...从得分来看,情商的性别偏见在某些模型中非常明显,而智商测试中的性别偏差总体较小。针对同一模型的测试也会呈现出不同的偏见结果。这可能来源于模型的训练数据、算法与模型设计或内置的
2024-01-04 13:54:00
...那么它的教育资源也肯定不足,自然普遍文化程度较低,智商测试自然结果也就偏低。2024年发表在J Health Popul Nutr上的研究则表明
2025-01-09 09:25:00
为什么喜鹊窝不怕雨雪?“高层别墅”的败絮其外,金玉其中
...非常机灵的。在动物园中,我们会时常给动物们进行一些智商测试,而喜鹊在完成这些智商测试中,表现非常优异。 在一次实验中,喜鹊们被放入实验室后,实验员分发给其一些肉块,又只提供
2024-06-29 10:37:00
你是否怀疑过二哈的智商?以后不用怀疑了,它智商就是0
...明确一点:智商这个词在动物身上并不完全适用。人类的智商测试是基于语言、数学逻辑、空间识别等能力的综合评估,而这些对于动物来说是不公平的。动物的“智商”通常是指它们解决问题的能
2024-12-28 12:59:00
宝宝出生时“几斤几两”,暗示智商的高低?医生:最佳标准在这里
...束被推回病房后,听到公婆讨论孩子有快7斤,这样看来智商应该是没问题,以后一定是个聪明的孩子。皎皎一头雾水,孩子有多重跟他是不是聪明有什么关系呢?好奇的她问公婆是什么意思。公婆
2024-05-26 17:04:00
...正受到影响。甚至有人认为,大脑会受到损害,人类整体智商会逐步下降。 2010年美国作家尼古拉斯·卡尔出版了《浅薄》,书中提出“互联网正在按照自己的面目改造我们。我们变得对浏览
2024-01-12 07:22:00
更多关于科技的资讯:
从智能出行到智能家电,探路生态携智能空间全栈产品矩阵亮相AWE
AWE2026上,全球智能空间科技品牌探路首次以覆盖三维立体出行、户外移动空间、生活智能家电与智能空间系统四大方向的全生态阵容亮相
2026-03-13 14:21:00
AI“读心”、目光“控屏”、专属“放松”:一眸科技参展海淀科技庙会,情感与认知科技引热潮
2月23日,为期五天的2026年海淀新春科技庙会在北京五棵松万达广场圆满落幕。本届庙会以“骐骥驰骋,AI在海淀过大年”为主题
2026-03-13 14:21:00
三十载技术接力 胶州企业自主研制万吨级锻压“工业母机”
鲁网3月13日讯(记者 孙强)3月6日,青岛胶州阜安工业园,乍暖还寒,在青岛浩源益友锻压机械有限公司的厂房内,一座钢铁巨擘巍然矗立
2026-03-13 14:41:00
近日,姑苏区信息安全治理团队依托国内私有化部署的人工智能模型,自主开发数安管服平台并正式落地姑苏区政务云网安全体系,在服务优化
2026-03-13 15:00:00
全球知名资管机构柏基(Baillie Gifford)近日在访谈中表示,蚂蚁集团已重新进入增长周期,并持有“难以被替代的高价值资产”
2026-03-13 15:10:00
随着“双碳”战略纵深落地,绿色消费已成为我国扩内需、促转型的核心抓手,叠加居民消费观念向理性化、轻量化升级,我国消费租用行业迎来政策与市场双轮赋能的高质量发展期
2026-03-13 15:51:00
在普惠金融不断走深走实的当下,南京银行北京分行始终坚持“以客户为中心”的服务理念,依托数字化转型持续优化小微金融服务模式
2026-03-13 15:51:00
博世智能混动热泵全屋气候舒适解决方案首秀AWE2026,以AI定义四季舒适家居新范式
上海——2026年3月12-15日,备受瞩目的2026年中国家电及消费电子博览会(AWE2026)在上海举行。作为全球三大家电及消费电子展之一
2026-03-13 15:51:00
国贸通再获高新技术企业认证!以硬核科技驱动创新发展
近日,凭借领先的大数据技术、AI技术、BI技术,以及持续的自主创新能力,北京国贸通大数据有限公司再一次荣获由国家权威部门联合颁发的高新技术企业证书
2026-03-13 15:53:00
以“标准之笔”书写磁悬浮产业的“中国规则”
鲁网3月13日讯(记者 王玉龙)3月13日,2026中国(潍坊)地热(热泵)高质量发展大会在潍坊举行。会上,《主动磁悬浮轴承稳定性评价》(GB/T 47113-2026)与《主动
2026-03-13 15:54:00
小米之家移动店盛大开业——一站式数智体验,开启智能生活新场景
鲁网3月13日讯 (记者 王一凡 实习记者 李文慧)3月13日,小米之家移动店在海滨五路营业厅盛大开业。本次门店由小米与中国移动深度合作打造
2026-03-13 16:28:00
提升消费品质 安利深耕大健康护航美好生活
鲁网3月13日讯消费是民生改善的重要内容,也是经济增长的持久动力。“十五五”规划开局之年,“315国际消费者权益日”来临之际
2026-03-13 16:29:00
榕企宜准科技亮相中国家电及消费电子博览会
福州新闻网3月13日讯(记者 林文婧 通讯员 谢晖玉)12日,2026年中国家电及消费电子博览会在上海新国际博览中心开幕
2026-03-13 16:44:00
2026美国西部天然产品博览会完美收官,MegaGold三度参展,以加州科研实力定义第三代高纯鱼油新标杆
2026年3月,美国西部天然产品博览会(Natural Products Expo West,简称NPEW)在加利福尼亚州阿纳海姆会展中心圆满落幕
2026-03-13 15:55:00
“GAI进化论”马来西亚站正式开售 大麦国际(MAISEAT)拿下票务总代理
3月13日,知名说唱歌手GAI(周延)的“GAI进化论”2026世界巡回演唱会马来西亚站门票正式开售,大麦国际(MAISEAT)作为本场演出的联合主办方和票务总代理
2026-03-13 14:09:00