• 我的订阅
  • 科技

美媒:GPT-4通过图灵测试

类别:科技 发布时间:2024-05-21 16:36:00 来源:每日看点快看

本文转自:参考消息

参考消息网5月21日报道 据美国未来主义网站5月17日报道,美国开放人工智能研究中心(OpenAI)的GPT-4是如此逼真,它可以欺骗超过50%的人类测试对象,让他们认为自己在和人类对话。

在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。

研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究人员会问受试者,他们认为自己刚才在和真人还是人工智能交谈。

正如这些科学家在尚未经过同行评议的论文中所报告的那样,结果显而易见:54%的受试者以为自己之前在和人类对话,但其实他们在与OpenAI的产品聊天。

图灵测试最早是由计算机科学先驱阿兰·图灵在1950年提出的,它更像是一个思想实验,而不是一系列实际测试。在最初的测试中,图灵安排了三名“参与者”——一名人类考官,一名不确定是人类还是机器的见证人,还有一名人类观察者。

加州大学圣迭戈分校的研究人员在研究中调整了图灵最初的三人配置,通过消除人类观察者来简化设置。然后,他们让500名参与者与四类见证者中的其中一类进行交流。这四类见证者分别是:另一个人、GPT-3.5、GPT-4或来自20世纪60年代的原始的“伊丽莎”聊天机器人。

卡梅伦·琼斯和本杰明·伯根假设,研究对象多数时候大体上能够分辨他们是在与人类还是“伊丽莎”交流,但当与OpenAI的大语言模型交流时,他们的正确率基本在50%。

事实证明,他们的预判相当准确。除了54%的人把GPT-4误认为人之外,刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊丽莎”误认为人相比,这个比例相当惊人。

尽管仍在评议中,但这篇论文已经在科技界掀起波澜,以太坊联合创始人维塔利克·布捷林在社交网络上宣称,在他看来,加州大学圣迭戈分校的研究“算是说明GPT-4通过图灵测试了”。

虽然其他人也声称观察到OpenAI的GPT模型通过了图灵测试,但布捷林的认可使这项研究脱颖而出——不过我们可能必须等待论文经过同行评议,才能发表任何更重大的声明。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-21 17:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...试成功率为41%,低于人类水平10月31日,加利福尼亚大学圣迭戈分校的研究者Cameron Jones和Benjamin Bergen发布了一份研究报告
2023-11-05 17:03:00
(聚焦博鳌)院士张亚勤:预计人工智能五年内在影音方面通过图灵测试
...界”分论坛上表示,预计五年内人工智能在影音方面通过图灵测试,五年后人工智能或将通过生物界图灵测试。张亚勤出席博鳌亚洲论坛2024年年会“AIGC改变世界”分论坛。记者 骆云飞
2024-03-27 22:56:00
【科学的温度】ChatGPT走红,人工智能离通过图灵测试还有多远?
...题。资料图:聂再清。受访者供图ChatGPT“有进步”,离图灵测试还有多远?Open AI此前发布了一款AI聊天机器人ChatGPT
2022-12-21 19:23:00
AI会爱上人类吗? 陈铭:现在不会,但未来完全可行
...激烈辩论。现场有超过30%的观众被AI“迷惑”了,根据“图灵测试”规则,标志着国内大模型首次通过人机辩论“图灵测试”。8月4日,陈铭接受了大皖新闻记者的采访。谈及AI在辩论时
2025-08-05 16:29:00
艾伦·麦席森·图灵——德国的谜机
...更多的人却说,这其实是因为有一个叫做艾伦·麦席森·图灵的科学家,他在41岁的时候,咬了一口涂有氢化物的毒苹果,中毒身亡,英年早逝。你知道我们现在所使用的电脑,为什么叫计算机吗
2023-08-10 06:52:00
AI的进展不是太快,而是太慢
...力和颠覆性力量,但整体上的进展不是太快,而是太慢。图灵测试2.0:抛弃它但又要回到它1950年的图灵测试说的是当一个人同不能看见的人与机器进行问答,又不能区分那个是人那个是机
2023-11-27 09:02:00
“聪明的”chatgpt,是否拥有生命?
...T。ChatGPT不是艾娃,但它也很“聪明”。ChatGPT还没有通过图灵测试进行彻底的评估,图灵测试是一种检测机器能否表现出与人类一样的智能水准的测试
2023-02-02 11:16:00
“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
...中国科学院软件研究所联合主办的有趣的计算机科学暨“图灵宇宙”系列新书预告会在第37届北京图书订货会举行。图灵奖有“计算机界的诺贝尔奖”之称,它的历史也是计算机科学发展史的缩影
2025-01-12 08:57:00
玩游戏还能推动人工智能发展?
...能呈现爆发式发展。 1950年,被誉为“人工智能之父”的图灵在人工智能领域的开创性论文《计算机器与智能》中提到了人工智能研究与游戏的关系,认为棋类游戏是展示机器“思维”能力
2023-05-09 01:56:00
更多关于科技的资讯:
江南时报讯 翩翩起舞、精准踢球、熟练做家务……多才多艺的机器人是外贸领域新焦点,而让机器人动作灵活起来的“秘密”则藏在一枚枚手掌大的谐波减速器里
2025-12-08 22:40:00
江南时报讯 “订单催得紧,就怕资金审批慢耽误生产,没想到泗洪农商银行的授信流程这么快!”泗洪县某服装加工小微企业负责人陈先生由衷点赞
2025-12-08 22:55:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿自主研发的“矿井提升机液压制动油温度自动调节装置”创新成果投入运行
2025-12-08 19:33:00
虎鲸文娱人才创作基地落户陵水,助力海归青年创作者“回家筑梦”
日前,第七届海南岛国际电影节“青椰计划”特别活动——虎鲸文娱集团旗下大麦娱乐“海纳圆桌对谈”在三亚举行。虎鲸文娱集团正式宣布
2025-12-08 13:54:00
平台默认勾选开启、强制关联支付软件、开通容易取消难……网络上,有关免密支付的“吐槽”层出不穷,反映出消费者对加强支付业务安全管理的迫切愿望
2025-12-08 12:30:00
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00