• 我的订阅
  • 科技

美媒:GPT-4通过图灵测试

类别:科技 发布时间:2024-05-21 16:36:00 来源:每日看点快看

本文转自:参考消息

参考消息网5月21日报道 据美国未来主义网站5月17日报道,美国开放人工智能研究中心(OpenAI)的GPT-4是如此逼真,它可以欺骗超过50%的人类测试对象,让他们认为自己在和人类对话。

在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。

研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究人员会问受试者,他们认为自己刚才在和真人还是人工智能交谈。

正如这些科学家在尚未经过同行评议的论文中所报告的那样,结果显而易见:54%的受试者以为自己之前在和人类对话,但其实他们在与OpenAI的产品聊天。

图灵测试最早是由计算机科学先驱阿兰·图灵在1950年提出的,它更像是一个思想实验,而不是一系列实际测试。在最初的测试中,图灵安排了三名“参与者”——一名人类考官,一名不确定是人类还是机器的见证人,还有一名人类观察者。

加州大学圣迭戈分校的研究人员在研究中调整了图灵最初的三人配置,通过消除人类观察者来简化设置。然后,他们让500名参与者与四类见证者中的其中一类进行交流。这四类见证者分别是:另一个人、GPT-3.5、GPT-4或来自20世纪60年代的原始的“伊丽莎”聊天机器人。

卡梅伦·琼斯和本杰明·伯根假设,研究对象多数时候大体上能够分辨他们是在与人类还是“伊丽莎”交流,但当与OpenAI的大语言模型交流时,他们的正确率基本在50%。

事实证明,他们的预判相当准确。除了54%的人把GPT-4误认为人之外,刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊丽莎”误认为人相比,这个比例相当惊人。

尽管仍在评议中,但这篇论文已经在科技界掀起波澜,以太坊联合创始人维塔利克·布捷林在社交网络上宣称,在他看来,加州大学圣迭戈分校的研究“算是说明GPT-4通过图灵测试了”。

虽然其他人也声称观察到OpenAI的GPT模型通过了图灵测试,但布捷林的认可使这项研究脱颖而出——不过我们可能必须等待论文经过同行评议,才能发表任何更重大的声明。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-21 17:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...试成功率为41%,低于人类水平10月31日,加利福尼亚大学圣迭戈分校的研究者Cameron Jones和Benjamin Bergen发布了一份研究报告
2023-11-05 17:03:00
(聚焦博鳌)院士张亚勤:预计人工智能五年内在影音方面通过图灵测试
...界”分论坛上表示,预计五年内人工智能在影音方面通过图灵测试,五年后人工智能或将通过生物界图灵测试。张亚勤出席博鳌亚洲论坛2024年年会“AIGC改变世界”分论坛。记者 骆云飞
2024-03-27 22:56:00
【科学的温度】ChatGPT走红,人工智能离通过图灵测试还有多远?
...题。资料图:聂再清。受访者供图ChatGPT“有进步”,离图灵测试还有多远?Open AI此前发布了一款AI聊天机器人ChatGPT
2022-12-21 19:23:00
AI会爱上人类吗? 陈铭:现在不会,但未来完全可行
...激烈辩论。现场有超过30%的观众被AI“迷惑”了,根据“图灵测试”规则,标志着国内大模型首次通过人机辩论“图灵测试”。8月4日,陈铭接受了大皖新闻记者的采访。谈及AI在辩论时
2025-08-05 16:29:00
艾伦·麦席森·图灵——德国的谜机
...更多的人却说,这其实是因为有一个叫做艾伦·麦席森·图灵的科学家,他在41岁的时候,咬了一口涂有氢化物的毒苹果,中毒身亡,英年早逝。你知道我们现在所使用的电脑,为什么叫计算机吗
2023-08-10 06:52:00
AI的进展不是太快,而是太慢
...力和颠覆性力量,但整体上的进展不是太快,而是太慢。图灵测试2.0:抛弃它但又要回到它1950年的图灵测试说的是当一个人同不能看见的人与机器进行问答,又不能区分那个是人那个是机
2023-11-27 09:02:00
“聪明的”chatgpt,是否拥有生命?
...T。ChatGPT不是艾娃,但它也很“聪明”。ChatGPT还没有通过图灵测试进行彻底的评估,图灵测试是一种检测机器能否表现出与人类一样的智能水准的测试
2023-02-02 11:16:00
“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
...中国科学院软件研究所联合主办的有趣的计算机科学暨“图灵宇宙”系列新书预告会在第37届北京图书订货会举行。图灵奖有“计算机界的诺贝尔奖”之称,它的历史也是计算机科学发展史的缩影
2025-01-12 08:57:00
玩游戏还能推动人工智能发展?
...能呈现爆发式发展。 1950年,被誉为“人工智能之父”的图灵在人工智能领域的开创性论文《计算机器与智能》中提到了人工智能研究与游戏的关系,认为棋类游戏是展示机器“思维”能力
2023-05-09 01:56:00
更多关于科技的资讯:
鲜养新势力:深度解析斛妈妈品牌的核心竞争力与养生价值在新中式养生浪潮席卷的当下,传统滋补品正经历着从“厚重礼品”到“日常刚需”的转型
2026-01-13 11:06:00
从超越到引领:东芝电视凭“四连冠”定义日本高端电视市场新秩序
日本权威调研机构株式会社BCN最新发布的“BCN AWARD 2026”数据显示,东芝 REGZA在2025年日本电视市场中表现突出
2026-01-13 11:08:00
贵州都匀:冲“鸭”!都匀茶香鸭拼出“开门红”
多彩贵州网讯 临近春节,记者走进贵州青色食品有限责任公司的生产车间,仍旧是一派热火朝天的生产景象。茶香与鸭肉香气交织,身着统一服装的工人们分工协作
2026-01-13 11:10:00
山东商务职业学院与科讯保链共建“创新创业实践基地”
鲁网1月13日讯(记者 魏萱)近日,山东商务职业学院会计金融学院与山东科讯保链数字科技有限公司共建的“创新创业实践基地”正式挂牌成立
2026-01-13 11:12:00
河北新闻网讯(成博浩、刘乾)“氢电无人机飞行姿态稳定,数据传输流畅,拍摄图片清晰……”1月5日,在邢台市南和区10千伏东盛线巡检现场
2026-01-13 11:26:00
文化立根,创新破局:茶馆行业的新趋势与新路径
2024年12月28日,第六届茶馆业大会在北京圆满闭幕。本次大会以“文化立根,创新破局”为主线,聚焦“十五五”时期茶馆行业的新趋势
2026-01-13 11:27:00
非遗手作入驻潮流商圈,VR技术让千年文物“活”起来,沉浸式剧场打破舞台与观众的边界⋯⋯新年伊始,创意迭出的消费新场景,早已跳脱出“买东西”的传统定义
2026-01-13 11:27:00
全项通过!蚂蚁数科FAIR平台完成国家级可信数据空间功能验证
近日,蚂蚁数科宣布其自主研发的FAIR可信数据空间平台在国家数据局指导下、由中国电子技术标准化研究院组织的可信数据空间功能测试中
2026-01-13 11:35:00
海尔X11洗衣机获西班牙“最佳家电及互联设备”奖
2025年12月初,海尔X11洗衣机荣获西班牙权威科技媒体Xataka颁发的年度“最佳家电及互联设备”奖。这一奖项在欧洲科技领域具有重要影响力
2026-01-13 11:47:00
海尔三筒、L+洗衣机登陆巴基斯坦填补高端空白
当地时间1月8日,海尔巴基斯坦经销商大会举办。会上,海尔洗衣机携全价位段产品矩阵亮相,并重点发布了2026年高端新品——三筒洗衣机与L+洗衣机
2026-01-13 11:48:00
如今H5婚礼电子请柬因环保方便成办婚礼“标配”,但近日“婚礼电子请柬访客记录”冲上热搜。网友发现,部分平台将访客浏览、转发记录设为付费会员服务
2026-01-13 11:49:00
中新经纬1月13日电 民政部13日举行专题新闻发布会,介绍《关于培育养老服务经营主体 促进银发经济发展的若干措施》有关情况
2026-01-13 12:20:00
打破国外垄断!芜湖长信“透视眼”传感器上岗,高端装备有了“中国芯”
大皖新闻讯 日前,芜湖长信科技股份有限公司(以下简称“长信科技”)生产车间内,一片片承载核心技术的玻璃器件接连下线。这些元件是高端X射线成像装备的“心脏”——大面积动态X射线成像传感器
2026-01-13 12:48:00
湖南构建一体化产业链助推航运与行业高质量发展
湖南常德聚豪船务有限公司凭借其清晰的战略定位与高效的业务整合能力,成功构建并持续完善覆盖“采挖、运输、销售”三大核心环节的一体化船务运营体系
2026-01-13 11:58:00
中新经纬1月13日电 上海市政府网站13日公布《上海市促进服务业提质增效和消费提振扩容联动发展的若干措施》(下称《若干措施》)
2026-01-13 12:05:00