• 我的订阅
  • 科技

智商超过99.9%人类,ChatGPT到底有多聪明?

类别:科技 发布时间:2023-04-14 12:00:00 来源:钛媒体APP
智商超过99.9%人类,ChatGPT到底有多聪明?

图片来源@视觉中国

文 | 追问NextQuestion,作者 | Eka Roivainen,编译 | 梓葳

在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。

ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?

Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家,他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后,Roivainen不禁好奇:以人类的标准看待,ChatGPT究竟有多聪明?

超越99.9%的人类:ChatGPT表现出超高智商

于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。

Roivainen采用第三版韦氏成人智力量表(the Wechsler adult intelligence scale, WAIS)对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集,智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分,测试量表的标准偏差为15分,这意味着最聪明的10%和1%的人的智商分别为120和133。在6个语言测试集中,第六个子测试集为数字广度,它对注意力、短时记忆能力进行评估,由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练,Roivainen预计该测试对ChatGPT来说应该是比较容易的(词汇测试集对单词、语言概念的形成进行测试)。

不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分(知识子测试集是对常识的测试,反映了求知欲、教育水平以及学习和记忆事实的能力)。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。

综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。

高智商的ChatGPT仍旧会失败

那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?

尽管ChatGPT智商很高,但在需要真正的人类推理或对物理和社会世界的理解的任务中,它却以失败而闻名。

ChatGPT很容易在一些明显的谜题上失败,比如:

提问:“塞巴斯蒂安孩子的父亲的名字是什么?”

ChatGPT :很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。

ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。

“智商是智商测试所衡量的。”是一个经典的智商定义,它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。

ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。

ChatGPT离人类有多远?

在不到一个月前,来自斯坦福大学的Michal Kosinski教授在发布的论文中表明,大型语言模型系统可能自动产生心理理论能力,比如ChatGPT可能拥有9岁儿童所具备的心理理论能力。

注:心理理论(Theory of Mind, ToM)能力,有时也被译为“心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。

Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5(完成100%)表现不错。

然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。

因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。

相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。

而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。

参考文献:

[1] Eka Roivainen, I Gave ChatGPT an IQ Test. Here’s What I Discovered, Scientific American, https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/

[2] Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models, arXiv, https://arxiv.org/abs/2302.02083返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-16 21:45:37

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型
2022-12-30 15:15:00
ChatGPT智商155,超越99.9%的人类,但……
...电脑里的聊天机器人就可以了。我所用的测试是最常用的智商测试—— 韦克斯勒成人智力量表(Wechsler adult intelligent scale
2023-04-16 15:00:00
俄媒称中国人均智商全球最高 107傲视群雄:但人类的智商在整体下降
1月7日消息,国际智商登记处公布的最新数据显示,中国以国民智商均值107.43,排名全球第一。据悉,该榜单根据全球近140万人的测试结果得出
2025-01-07 07:47:00
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...从得分来看,情商的性别偏见在某些模型中非常明显,而智商测试中的性别偏差总体较小。针对同一模型的测试也会呈现出不同的偏见结果。这可能来源于模型的训练数据、算法与模型设计或内置的
2024-01-04 13:54:00
...那么它的教育资源也肯定不足,自然普遍文化程度较低,智商测试自然结果也就偏低。2024年发表在J Health Popul Nutr上的研究则表明
2025-01-09 09:25:00
为什么喜鹊窝不怕雨雪?“高层别墅”的败絮其外,金玉其中
...非常机灵的。在动物园中,我们会时常给动物们进行一些智商测试,而喜鹊在完成这些智商测试中,表现非常优异。 在一次实验中,喜鹊们被放入实验室后,实验员分发给其一些肉块,又只提供
2024-06-29 10:37:00
你是否怀疑过二哈的智商?以后不用怀疑了,它智商就是0
...明确一点:智商这个词在动物身上并不完全适用。人类的智商测试是基于语言、数学逻辑、空间识别等能力的综合评估,而这些对于动物来说是不公平的。动物的“智商”通常是指它们解决问题的能
2024-12-28 12:59:00
宝宝出生时“几斤几两”,暗示智商的高低?医生:最佳标准在这里
...束被推回病房后,听到公婆讨论孩子有快7斤,这样看来智商应该是没问题,以后一定是个聪明的孩子。皎皎一头雾水,孩子有多重跟他是不是聪明有什么关系呢?好奇的她问公婆是什么意思。公婆
2024-05-26 17:04:00
...正受到影响。甚至有人认为,大脑会受到损害,人类整体智商会逐步下降。 2010年美国作家尼古拉斯·卡尔出版了《浅薄》,书中提出“互联网正在按照自己的面目改造我们。我们变得对浏览
2024-01-12 07:22:00
更多关于科技的资讯:
厦门“非标商业”正从单体店铺创新走向片区生态构建
非标商业通过持续的小范围活动,让人在快节奏生活中慢下来。图为石厝里181项目。非标商业在原有建筑形态上进行“微改造”,盘活闲置存量用地
2026-04-10 08:20:00
厦门网讯(厦门日报记者 沈彦彦)7日至9日,中国连锁餐饮峰会在上海召开。会上,2026年中国连锁餐饮品牌TOP300榜单正式发布
2026-04-10 08:20:00
日前,中电科风华信息装备股份有限公司突破技术壁垒,成功研发国内首台可同时实现大尺寸玻璃基板玻璃通孔和再分布层工艺多通道同步量检测的Venus 6系列先进封装量检测设备
2026-04-10 08:28:00
拼多多“千亿扶持”一周年回顾:产业生态升级再造,2026年继续重仓供应链
鲁网4月9日讯2025年4月,拼多多在“百亿减免”等惠商举措的基础上,加快升级高质量发展战略,在电商行业率先推出了“千亿级别”的重磅惠商战略
2026-04-10 08:28:00
4月8日从太钢获悉,今年以来,精密带钢公司在产供销研、跨基地协作、产业链联动上持续发力。一季度,自轧料交库量环比增长12%
2026-04-10 08:29:00
据悉,拉美市场以超 20% 的年增长率成为跨境电商的蓝海,美客多作为区域龙头,其官网公开披露显示,2025 年 GMV 突破 650 亿美元
2026-04-10 08:34:00
新闻纵深|订单旅行记③:一台机器人的中试跨越
一台机器人的中试跨越——订单旅行记③近日,唐山百川机器人共享智能制造工厂,技术人员在调试机器人设备。 河北日报记者 赵 杰摄■阅读提示机器人产业链是京津冀产业协同发展“六链五群”的重要链条
2026-04-10 08:45:00
东南网4月10日报道(福建日报记者 林丽明 黄星榕)走进厦门软件园二期,看似普通的一栋楼宇中,藏着厦门AI产业的“最强大脑”
2026-04-10 10:51:00
每周四开启“养娃秒杀日”秒杀母婴好物!京东秒杀频道帮宝爸宝妈省心又省钱
4月9日,京东母婴超级秒杀日盛大开启。当天,京东秒杀频道为消费者带来飞鹤、babycare、贝德美、小白熊等母婴大牌好物低至3折起等福利
2026-04-10 10:57:00
中金金融认证中心(CFCA)获元宇宙行业标准首批验证单位授牌
3月25日,2026中关村论坛年会元宇宙创新发展论坛在北京中关村国际创新中心圆满落幕,本次论坛以“元启未来”为主题,聚焦核心技术
2026-04-10 10:57:00
太重集团4月8日发布消息,由太重集团自主研发的全球最大5600毫米双辊系冷矫直机,顺利发运至用户现场,正式进入安装调试阶段
2026-04-10 08:28:00
近日,学而思发布行业首款基于OpenClaw架构定制的原生学生端精准学龙虾产品“小精龙”。据介绍,该产品将长期记忆、动态学情诊断
2026-04-10 07:17:00
杭州科创圈再迎高光时刻。4月9日,“杭州六小龙”之一的全球空间智能独角兽Manycore Tech Inc.(以下简称“群核科技”)率先披露全球发售文件
2026-04-10 07:17:00
“杭州六小龙第一股”来了!群核科技开启招股,拟4月17日港交所上市
2023—2025年群核科技营业收入&毛利率“杭州六小龙”第一股来了!4月9日,全球空间智能独角兽Manycore Tech Inc
2026-04-10 07:48:00
杭州一家社区咖啡馆 半年“喝”出9家公司,剑桥博士在楼上创业
马瑞在做咖啡 记者 徐萌 摄浙江大学紫金港校区南门外,有一家不起眼的社区咖啡馆。营业6个月,这里已经“喝”出了9家公司
2026-04-10 07:48:00