• 我的订阅
  • 科技

AI语言模型在智商测试中胜过人类

类别:科技 发布时间:2022-12-30 15:15:00 来源:每日看点快看

本文转自:新华网

新华社北京12月30日电 《参考消息》30日刊载美国科研成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:

美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型“生成型已训练变换模型3”(GPT-3)的成绩明显优于普通大学生。该程序利用深度学习生成类似人类语言的文本。

由美国开放人工智能研究中心(OpenAI)研发的GPT-3有很多用途,包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是目前规模最大、功能最强的语言处理人工智能模型之一。

这项新研究在常识、美国高校入学资格考试(SAT)成绩和智商这3个方面比较了GPT-3和人类的表现。发表在阿奇夫论文预印本网站上的研究结果显示,在这3个类别中,人工智能语言模型的成绩都高于人类。

研究人员在研究报告中写道:“我们发现,GPT-3展示出了惊人的抽象图案归纳能力,在解答大多数题目时表现和人类不相上下,甚至更好。我们的研究结果表明,像GPT-3这样的大型语言模型已经具备用零样本学习方法解决一系列类比问题的初步能力。”该报告有待同行评议。

研究小组还说,GPT-3“通过与生物智能截然不同的路径,被动形成了类似人类类比推理能力的机制,尽管它并未在这方面经过明确训练”。

这项研究发现,能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。

人工智能专家、作家艾伦·汤普森博士说,GPT-3的智商超过120。毫无疑问,这属于“天资聪慧”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2022-12-30 16:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...从得分来看,情商的性别偏见在某些模型中非常明显,而智商测试中的性别偏差总体较小。针对同一模型的测试也会呈现出不同的偏见结果。这可能来源于模型的训练数据、算法与模型设计或内置的
2024-01-04 13:54:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...ChatGPT表现出超高智商于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试
2023-04-14 12:00:00
ChatGPT智商155,超越99.9%的人类,但……
...电脑里的聊天机器人就可以了。我所用的测试是最常用的智商测试—— 韦克斯勒成人智力量表(Wechsler adult intelligent scale
2023-04-16 15:00:00
微软推出全能型人工智能模型 Kosmos-1
...像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智
2023-03-04 23:10:00
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友们纷纷表示太疯狂了。好巧不巧的是,o1 在最新门萨智商测试中,IQ 水平竟超过了 120 分。35 个智商题,答对了 25 道
2024-09-18 09:49:00
...那么它的教育资源也肯定不足,自然普遍文化程度较低,智商测试自然结果也就偏低。2024年发表在J Health Popul Nutr上的研究则表明
2025-01-09 09:25:00
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...情。如果你愿意,可以让任何一个人不及格。LLM与人类的智商相去甚远,但把它们放在极端的测试中不会很好地评估它们。 还有人劝诫道,朋友们,现在辞职太早了。加大难度:100、1
2024-07-01 08:58:00
ChatGPT该给语音助手们补补“智商”了
...够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的AI助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。更或许,当AI越来越聪明
2023-03-14 11:12:00
“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了
...。畅想一下未来综合以上,讯飞星火认知大模型在情商、智商、逆商不错的表现能力,有目共睹。不过,这也引发了不少从业者的焦虑,现在不妨也让它来与我们一起畅想一下未来。当问及和人类的
2023-05-07 03:00:00
更多关于科技的资讯:
中新经纬4月4日电 (张芷菡)一个小篮子加上一把小铲子,钻进郊野就能收获春天。如今,挖野菜已从老年“养生局”变成了年轻人的“潮流局”
2026-04-04 20:12:00
4月4日,央视新闻客户端以《春暖花开换装忙换季消费带热“春日经济”》为题,报道了太原服装市场迎来换季消费高峰,春装热销持续拉动“春日经济”升温
2026-04-04 17:35:00
廊坊建成全国首个省级算力监测调度平台。
2026-04-04 18:26:00
中新经纬4月4日电 (宋亚芬)对于数以万计通过小包裹把“中国制造”卖往全球的中小电商来说,退货这条“回家路”曾困难重重
2026-04-04 18:04:00
近日,平安银行“基于iDeal平台的AI做市报价机器人项目”荣膺2025年深圳金融创新大赛二等奖。该大赛由深圳市地方金融管理局
2026-04-04 15:34:00
4月4日消息,千问AI打车清明假期订单量周环比增长超1500%,用户使用规模极速攀升。该功能于3月23日上线,距今不足两周
2026-04-04 11:41:00
千问3.6Plus大模型登顶全球模型调用排行榜首
4月4日消息,发布仅1天的千问新模型Qwen3.6-Plus,冲上全球知名大模型API调用平台OpenRouter的日榜榜首
2026-04-04 11:41:00
涌金楼丨浙企正在资本市场进行一场“春耕”
浙江企业正在资本市场进行一场“春耕”。截至3月31日,13家浙企登陆港交所、上交所、北交所。短短三个月,春意渐浓——这正是观察浙江产业升级的鲜活切面
2026-04-04 12:46:00
数智赋能新体验 山东移动高唐分公司助力宾馆智慧升级
鲁网4月3日讯随着人工智能、物联网等数字技术的快速发展,智慧化服务正加速融入日常生活。近日,山东移动高唐分公司充分发挥全光网络与云网能力
2026-04-04 08:27:00
中新经纬4月3日电 (宋亚芬)“人车家互联”迎来政策层面的推动。工信部等九部门近日联合印发的《推动物联网产业创新发展行动方案(2026-2028年)》中
2026-04-04 11:00:00
近日,世界超级摩托车锦标赛葡萄牙站赛场上传来好消息,中国摩托车制造商“张雪机车”以近4秒的绝对优势获得冠军,成绩断崖式碾压杜卡迪
2026-04-04 08:54:00
厦企造具身智能机器人加速商业化场景落地
厦企小鹭智能研发的四足巡检机器人,可承担全天候智能巡检任务。(小鹭智能 供图)厦门网讯(厦门日报记者 林露虹 实习生 陈慧)除了登台表演
2026-04-04 08:43:00
亿纬锂能6.9MWh储能系统亮相ESIE 2026,以确定性量产交付领跑储能大电池赛道
当储能行业走过概念验证的探索期,真正的考验才刚刚开始。过去两年,从280Ah、300Ah到500Ah+,从5MWh到6MWh以上
2026-04-03 21:50:00
华之杰(603400)定位于智能控制行业,致力于以锂电池电源管理、智能控制、无刷电机驱动和控制等技术为核心,主要为锂电电动工具
2026-04-03 22:31:00