• 我的订阅
  • 科技

AI语言模型在智商测试中胜过人类

类别:科技 发布时间:2022-12-30 15:15:00 来源:每日看点快看

本文转自:新华网

新华社北京12月30日电 《参考消息》30日刊载美国科研成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:

美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型“生成型已训练变换模型3”(GPT-3)的成绩明显优于普通大学生。该程序利用深度学习生成类似人类语言的文本。

由美国开放人工智能研究中心(OpenAI)研发的GPT-3有很多用途,包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是目前规模最大、功能最强的语言处理人工智能模型之一。

这项新研究在常识、美国高校入学资格考试(SAT)成绩和智商这3个方面比较了GPT-3和人类的表现。发表在阿奇夫论文预印本网站上的研究结果显示,在这3个类别中,人工智能语言模型的成绩都高于人类。

研究人员在研究报告中写道:“我们发现,GPT-3展示出了惊人的抽象图案归纳能力,在解答大多数题目时表现和人类不相上下,甚至更好。我们的研究结果表明,像GPT-3这样的大型语言模型已经具备用零样本学习方法解决一系列类比问题的初步能力。”该报告有待同行评议。

研究小组还说,GPT-3“通过与生物智能截然不同的路径,被动形成了类似人类类比推理能力的机制,尽管它并未在这方面经过明确训练”。

这项研究发现,能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。

人工智能专家、作家艾伦·汤普森博士说,GPT-3的智商超过120。毫无疑问,这属于“天资聪慧”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2022-12-30 16:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...从得分来看,情商的性别偏见在某些模型中非常明显,而智商测试中的性别偏差总体较小。针对同一模型的测试也会呈现出不同的偏见结果。这可能来源于模型的训练数据、算法与模型设计或内置的
2024-01-04 13:54:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...ChatGPT表现出超高智商于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试
2023-04-14 12:00:00
ChatGPT智商155,超越99.9%的人类,但……
...电脑里的聊天机器人就可以了。我所用的测试是最常用的智商测试—— 韦克斯勒成人智力量表(Wechsler adult intelligent scale
2023-04-16 15:00:00
微软推出全能型人工智能模型 Kosmos-1
...像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智
2023-03-04 23:10:00
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友们纷纷表示太疯狂了。好巧不巧的是,o1 在最新门萨智商测试中,IQ 水平竟超过了 120 分。35 个智商题,答对了 25 道
2024-09-18 09:49:00
...那么它的教育资源也肯定不足,自然普遍文化程度较低,智商测试自然结果也就偏低。2024年发表在J Health Popul Nutr上的研究则表明
2025-01-09 09:25:00
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...情。如果你愿意,可以让任何一个人不及格。LLM与人类的智商相去甚远,但把它们放在极端的测试中不会很好地评估它们。 还有人劝诫道,朋友们,现在辞职太早了。加大难度:100、1
2024-07-01 08:58:00
ChatGPT该给语音助手们补补“智商”了
...够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的AI助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。更或许,当AI越来越聪明
2023-03-14 11:12:00
“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了
...。畅想一下未来综合以上,讯飞星火认知大模型在情商、智商、逆商不错的表现能力,有目共睹。不过,这也引发了不少从业者的焦虑,现在不妨也让它来与我们一起畅想一下未来。当问及和人类的
2023-05-07 03:00:00
更多关于科技的资讯:
2月14日消息,2026年“新春招聘月”系列活动将于2月24日(正月初八)在五一广场太原人才大市场(迎泽区零工示范站)正式启幕
2026-02-14 17:37:00
星火空间完成数千万天使+轮融资 核心产品“进化一号”发动机完成首次试车
大皖新闻讯 此前关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称“星火空间”)落户合肥新站高新区
2026-02-14 18:45:00
国医大师李佃贵为2026雄安国际医疗大健康技术应用大赛发声推介。他表示,当下是中西医并重、传统智慧与现代科技深度融合的时代,中医核心思想与大健康领域发展目标高度契合,期待中医药领
2026-02-14 19:13:00
中国科大取得重要突破 首次实现量子李雅普诺夫指数的精确提取
大皖新闻讯 ”这一结果意义重大,为观测混沌的量子世界提供了全新视角。”相关人员如此评价说。2月14日,大皖新闻记者从中国科学技术大学获悉
2026-02-14 17:35:00
鲁网2月14日讯为提升居民网络使用体验,助力智慧社区建设,近日,山东移动临沂分公司装维团队深入多个社区,开展 “移动装维进社区”专项服务活动
2026-02-14 15:10:00
山东移动临沂分公司:智慧装维服务升级,开启家庭网络新体验
鲁网2月14日讯“您好,我是中国移动装维工程师张师傅,现在上门为您检测网络,这是我的工作证件。”周六上午9点,临沂北城新区书香苑小区的王女士刚结束早间会议
2026-02-14 15:11:00
字节跳动发布豆包大模型2.0,主打真实世界复杂任务执行力
在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2
2026-02-14 15:35:00
从米兰冬奥会看全球消费趋势:为何“由你”成了2026年的新叙事?
过去十年,全球化品牌的策略多为“We are the best”,强调品牌的权威感。但现在的趋势是“Its your turn”
2026-02-14 16:20:00
千问大免单再加3天,邀请全国人民体验AI买电影票,激活春节AI新消费
2月14日,千问突然宣布免单再加3天,接入大麦、飞猪,邀请全国人民体验AI买电影票、门票等新功能,激活春节AI新消费。从今天下午3点到大年初一
2026-02-14 16:36:00
依据河北省消费者权益保护委员会联合北京阳光消费大数据研究院于2025年8月发布的智能坐便器比较试验结果,九牧送检样品(型号ZD9640-SA-CJM000
2026-02-14 15:10:00
随着春节的脚步渐近,一场年味十足的“消费盛宴”即将开启。在春节9天假期里,围绕新春采购、美食盛宴、文旅消费、假期休闲等领域
2026-02-14 15:36:00
中亦科技荣膺徽商银行“核心系统3.0”项目“最佳合作伙伴奖”
近日,在徽商银行“核心系统3.0”建设项目总结表彰中,中亦科技凭借在金融核心场域的深度贡献,荣获“最佳合作伙伴奖”。唯一殊荣
2026-02-14 12:50:00
东阿生力源阿胶股份有限公司:千年阿胶文化的传承者与创新者
东阿生力源阿胶股份有限公司,成立于2002年,坐落于“千年阿胶福寿乡”——山东东阿黄河之滨,历经二十多年的深耕细作,现已发展为一家集阿胶等生物养生滋补品研发创新
2026-02-14 12:52:00
作为浙江省第一家海洋生物医药类上市公司,浙江诚意药业股份有限公司(下称“诚意药业”,股票代码:603811)深耕海洋生物医药领域多年
2026-02-14 11:53:00