• 我的订阅
  • 科技

AI语言模型在智商测试中胜过人类

类别:科技 发布时间:2022-12-30 15:15:00 来源:每日看点快看

本文转自:新华网

新华社北京12月30日电 《参考消息》30日刊载美国科研成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:

美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型“生成型已训练变换模型3”(GPT-3)的成绩明显优于普通大学生。该程序利用深度学习生成类似人类语言的文本。

由美国开放人工智能研究中心(OpenAI)研发的GPT-3有很多用途,包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是目前规模最大、功能最强的语言处理人工智能模型之一。

这项新研究在常识、美国高校入学资格考试(SAT)成绩和智商这3个方面比较了GPT-3和人类的表现。发表在阿奇夫论文预印本网站上的研究结果显示,在这3个类别中,人工智能语言模型的成绩都高于人类。

研究人员在研究报告中写道:“我们发现,GPT-3展示出了惊人的抽象图案归纳能力,在解答大多数题目时表现和人类不相上下,甚至更好。我们的研究结果表明,像GPT-3这样的大型语言模型已经具备用零样本学习方法解决一系列类比问题的初步能力。”该报告有待同行评议。

研究小组还说,GPT-3“通过与生物智能截然不同的路径,被动形成了类似人类类比推理能力的机制,尽管它并未在这方面经过明确训练”。

这项研究发现,能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。

人工智能专家、作家艾伦·汤普森博士说,GPT-3的智商超过120。毫无疑问,这属于“天资聪慧”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2022-12-30 16:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...从得分来看,情商的性别偏见在某些模型中非常明显,而智商测试中的性别偏差总体较小。针对同一模型的测试也会呈现出不同的偏见结果。这可能来源于模型的训练数据、算法与模型设计或内置的
2024-01-04 13:54:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...ChatGPT表现出超高智商于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试
2023-04-14 12:00:00
ChatGPT智商155,超越99.9%的人类,但……
...电脑里的聊天机器人就可以了。我所用的测试是最常用的智商测试—— 韦克斯勒成人智力量表(Wechsler adult intelligent scale
2023-04-16 15:00:00
微软推出全能型人工智能模型 Kosmos-1
...像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智
2023-03-04 23:10:00
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友们纷纷表示太疯狂了。好巧不巧的是,o1 在最新门萨智商测试中,IQ 水平竟超过了 120 分。35 个智商题,答对了 25 道
2024-09-18 09:49:00
...那么它的教育资源也肯定不足,自然普遍文化程度较低,智商测试自然结果也就偏低。2024年发表在J Health Popul Nutr上的研究则表明
2025-01-09 09:25:00
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...情。如果你愿意,可以让任何一个人不及格。LLM与人类的智商相去甚远,但把它们放在极端的测试中不会很好地评估它们。 还有人劝诫道,朋友们,现在辞职太早了。加大难度:100、1
2024-07-01 08:58:00
ChatGPT该给语音助手们补补“智商”了
...够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的AI助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。更或许,当AI越来越聪明
2023-03-14 11:12:00
“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了
...。畅想一下未来综合以上,讯飞星火认知大模型在情商、智商、逆商不错的表现能力,有目共睹。不过,这也引发了不少从业者的焦虑,现在不妨也让它来与我们一起畅想一下未来。当问及和人类的
2023-05-07 03:00:00
更多关于科技的资讯:
万载县株潭中心幼儿园:一物多玩 让材料“活”起来
为帮助教师掌握“一物多玩”核心思想与基础玩法,打破器材固定使用思维,建立“器材为能力服务”的意识,万载县株潭镇中心幼儿园于2025年12月25日下午
2025-12-30 11:14:00
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:17:00
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:18:00
博士创新站典型案例|英利能源发展有限公司博士创新站:产学研协同破局,填补国内光伏质检领域技术空白
在“双碳”战略与光伏产业智能化转型背景下,英利能源联合河北工业大学陈海永博士团队共建博士创新站,成功研发并应用“光伏组件可靠性检测视觉大模型”
2025-12-30 11:40:00
在食品工业转型升级浪潮中,核桃精深加工与高附加值开发是产业高质量发展的关键。河北养元智汇饮品股份有限公司(以下简称“养元公司”)深耕核桃饮品领域多年
2025-12-30 11:40:00
博士创新站典型案例|河北鼎联科技有限公司博士创新站:校企联合攻关,驱动文博文旅产业智变
当前,文博文旅行业在数字化转型中面临数据资源分散、技术标准缺失、国外解决方案主导等瓶颈。河北鼎联科技有限公司联合河北地质大学杨丽花博士团队共建博士创新站
2025-12-30 11:45:00
专访“优秀侍茄师”马慧明: 雪茄爱好者到雪茄文化宣传者的蜕变之路
随着国产雪茄行业的快速发展,一个名为“侍茄师”的职业正悄然从冷门走向台前。他们不仅是雪茄文化的传承者,更是雪茄文化传播的核心力量
2025-12-30 11:50:00
教育与科技相交起舞—临沂联通“云网数智安”赋能区域教育数字化转型
鲁网12月30日讯 (记者 李文静 通讯员 沈慧卿)2025年7月,山东省教育厅等10部门联合印发《山东省“人工智能+教育”实施方案》
2025-12-30 11:52:00
“看不见的手术刀”尽显中国智造锋芒,海扶刀亮相国博中国制造“十四五” 成就展
什么是“看不见的手术刀”?它如何代表中国高端医疗设备制造的锋芒?2025年12月30日起,在中国国家博物馆举行的“筑基强国路——中国制造‘十四五’成就展”上
2025-12-30 13:13:00
薰风KUMPOO亮相广州文交会,共谱运动文化新章
创办于2017年的广州文交会,迄今已成功举办7届,展会规模、成交金额和影响力逐年提升,品牌效应和辐射功能逐步凸显,实现了从无到有
2025-12-30 13:51:00
3亿人参与冰雪运动后,天猫打造“雪上空港”再燃冰雪经济
12月25日,在距离北京市中心200公里的崇礼雪场,天猫打造了一场沉浸式冰雪大秀,在云顶雪场Big Air大跳台,交响乐团现场演奏与专业滑手大跳台专业表演交织
2025-12-30 11:05:00
火炬高新区已培育上百家国家级专精特新“小巨人”企业
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏 陈晓敏)如果要衡量区域的科创硬实力和发展后劲,专精特新“小巨人”企业的集聚度无疑是一个关键指标
2025-12-30 08:16:00
浙江日报讯 (记者 沈超 石磊 共享联盟·金华开发区 俞夏冰) 知识产权路演,是促进创新成果从实验室走向市场的关键一招
2025-12-30 08:39:00
野蛮生长近二十年的充电宝行业,不到半年就掉进了漩涡。据了解,工信部已于10月及11月多次组织召开《移动电源安全技术规范》征求意见稿研讨会
2025-12-30 08:40:00
在贵州省贵阳市的繁华商圈中,一家传统与现代相结合的特殊金融机构正悄然改变着人们对典当行业的刻板印象。贵州中泰星诚典当有限公司凭借其专业化
2025-12-30 08:52:00