• 我的订阅
  • 科技

美媒:GPT-4通过图灵测试

类别:科技 发布时间:2024-05-21 16:36:00 来源:每日看点快看

本文转自:参考消息

参考消息网5月21日报道 据美国未来主义网站5月17日报道,美国开放人工智能研究中心(OpenAI)的GPT-4是如此逼真,它可以欺骗超过50%的人类测试对象,让他们认为自己在和人类对话。

在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。

研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究人员会问受试者,他们认为自己刚才在和真人还是人工智能交谈。

正如这些科学家在尚未经过同行评议的论文中所报告的那样,结果显而易见:54%的受试者以为自己之前在和人类对话,但其实他们在与OpenAI的产品聊天。

图灵测试最早是由计算机科学先驱阿兰·图灵在1950年提出的,它更像是一个思想实验,而不是一系列实际测试。在最初的测试中,图灵安排了三名“参与者”——一名人类考官,一名不确定是人类还是机器的见证人,还有一名人类观察者。

加州大学圣迭戈分校的研究人员在研究中调整了图灵最初的三人配置,通过消除人类观察者来简化设置。然后,他们让500名参与者与四类见证者中的其中一类进行交流。这四类见证者分别是:另一个人、GPT-3.5、GPT-4或来自20世纪60年代的原始的“伊丽莎”聊天机器人。

卡梅伦·琼斯和本杰明·伯根假设,研究对象多数时候大体上能够分辨他们是在与人类还是“伊丽莎”交流,但当与OpenAI的大语言模型交流时,他们的正确率基本在50%。

事实证明,他们的预判相当准确。除了54%的人把GPT-4误认为人之外,刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊丽莎”误认为人相比,这个比例相当惊人。

尽管仍在评议中,但这篇论文已经在科技界掀起波澜,以太坊联合创始人维塔利克·布捷林在社交网络上宣称,在他看来,加州大学圣迭戈分校的研究“算是说明GPT-4通过图灵测试了”。

虽然其他人也声称观察到OpenAI的GPT模型通过了图灵测试,但布捷林的认可使这项研究脱颖而出——不过我们可能必须等待论文经过同行评议,才能发表任何更重大的声明。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-21 17:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...试成功率为41%,低于人类水平10月31日,加利福尼亚大学圣迭戈分校的研究者Cameron Jones和Benjamin Bergen发布了一份研究报告
2023-11-05 17:03:00
(聚焦博鳌)院士张亚勤:预计人工智能五年内在影音方面通过图灵测试
...界”分论坛上表示,预计五年内人工智能在影音方面通过图灵测试,五年后人工智能或将通过生物界图灵测试。张亚勤出席博鳌亚洲论坛2024年年会“AIGC改变世界”分论坛。记者 骆云飞
2024-03-27 22:56:00
【科学的温度】ChatGPT走红,人工智能离通过图灵测试还有多远?
...题。资料图:聂再清。受访者供图ChatGPT“有进步”,离图灵测试还有多远?Open AI此前发布了一款AI聊天机器人ChatGPT
2022-12-21 19:23:00
AI会爱上人类吗? 陈铭:现在不会,但未来完全可行
...激烈辩论。现场有超过30%的观众被AI“迷惑”了,根据“图灵测试”规则,标志着国内大模型首次通过人机辩论“图灵测试”。8月4日,陈铭接受了大皖新闻记者的采访。谈及AI在辩论时
2025-08-05 16:29:00
艾伦·麦席森·图灵——德国的谜机
...更多的人却说,这其实是因为有一个叫做艾伦·麦席森·图灵的科学家,他在41岁的时候,咬了一口涂有氢化物的毒苹果,中毒身亡,英年早逝。你知道我们现在所使用的电脑,为什么叫计算机吗
2023-08-10 06:52:00
AI的进展不是太快,而是太慢
...力和颠覆性力量,但整体上的进展不是太快,而是太慢。图灵测试2.0:抛弃它但又要回到它1950年的图灵测试说的是当一个人同不能看见的人与机器进行问答,又不能区分那个是人那个是机
2023-11-27 09:02:00
“聪明的”chatgpt,是否拥有生命?
...T。ChatGPT不是艾娃,但它也很“聪明”。ChatGPT还没有通过图灵测试进行彻底的评估,图灵测试是一种检测机器能否表现出与人类一样的智能水准的测试
2023-02-02 11:16:00
“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
...中国科学院软件研究所联合主办的有趣的计算机科学暨“图灵宇宙”系列新书预告会在第37届北京图书订货会举行。图灵奖有“计算机界的诺贝尔奖”之称,它的历史也是计算机科学发展史的缩影
2025-01-12 08:57:00
玩游戏还能推动人工智能发展?
...能呈现爆发式发展。 1950年,被誉为“人工智能之父”的图灵在人工智能领域的开创性论文《计算机器与智能》中提到了人工智能研究与游戏的关系,认为棋类游戏是展示机器“思维”能力
2023-05-09 01:56:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者 张安琪9月23日,2025南京金秋经贸洽谈会开幕式上,一批全球首个、国内首批、性能全球最高的科技成果密集亮相
2025-10-06 09:49:00
国庆中秋长假期间,新能源汽车已成为众多家庭出游的重要选择。为进一步破解高速服务区“充电难、排队久”的现实困境,山西交控集团坚持“科技创新+服务升级”双轮驱动
2025-10-06 18:01:00
邮储信用卡气球雨惊喜派对即将空降青岛李沧万达,国庆中秋邀您共启幸运之旅!
鲁网9月30日讯2025年国庆、中秋双节同庆之际,为回馈广大市民与持卡人长期以来的支持,邮储银行青岛分行将于10月1日-8日
2025-10-06 14:11:00
□南京日报/紫金山新闻记者 于洁尘 通讯员陈天骄“干我们这行的,哪有节假日?越是假期越要忙。”10月5日一大早,28岁的陈潇离开南京
2025-10-06 09:48:00
节日我在岗丨十堰高周波:抓创新赶订单 全力冲刺年度目标
十堰广电讯(全媒体记者 陈林)在国庆中秋假期,位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单,全力冲刺年度目标
2025-10-05 20:21:00
节日我在岗丨艾斯卓智能科技:节日不休 赶制订单
十堰广电讯(全媒体记者 耿吉国)放假不放松,生产不停工。国庆中秋长假,我市各生产企业铆足干劲抓生产、赶订单,奋力冲刺年度目标任务
2025-10-05 20:21:00
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00