• 我的订阅
  • 科技

美媒:GPT-4通过图灵测试

类别:科技 发布时间:2024-05-21 16:36:00 来源:每日看点快看

本文转自:参考消息

参考消息网5月21日报道 据美国未来主义网站5月17日报道,美国开放人工智能研究中心(OpenAI)的GPT-4是如此逼真,它可以欺骗超过50%的人类测试对象,让他们认为自己在和人类对话。

在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。

研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究人员会问受试者,他们认为自己刚才在和真人还是人工智能交谈。

正如这些科学家在尚未经过同行评议的论文中所报告的那样,结果显而易见:54%的受试者以为自己之前在和人类对话,但其实他们在与OpenAI的产品聊天。

图灵测试最早是由计算机科学先驱阿兰·图灵在1950年提出的,它更像是一个思想实验,而不是一系列实际测试。在最初的测试中,图灵安排了三名“参与者”——一名人类考官,一名不确定是人类还是机器的见证人,还有一名人类观察者。

加州大学圣迭戈分校的研究人员在研究中调整了图灵最初的三人配置,通过消除人类观察者来简化设置。然后,他们让500名参与者与四类见证者中的其中一类进行交流。这四类见证者分别是:另一个人、GPT-3.5、GPT-4或来自20世纪60年代的原始的“伊丽莎”聊天机器人。

卡梅伦·琼斯和本杰明·伯根假设,研究对象多数时候大体上能够分辨他们是在与人类还是“伊丽莎”交流,但当与OpenAI的大语言模型交流时,他们的正确率基本在50%。

事实证明,他们的预判相当准确。除了54%的人把GPT-4误认为人之外,刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊丽莎”误认为人相比,这个比例相当惊人。

尽管仍在评议中,但这篇论文已经在科技界掀起波澜,以太坊联合创始人维塔利克·布捷林在社交网络上宣称,在他看来,加州大学圣迭戈分校的研究“算是说明GPT-4通过图灵测试了”。

虽然其他人也声称观察到OpenAI的GPT模型通过了图灵测试,但布捷林的认可使这项研究脱颖而出——不过我们可能必须等待论文经过同行评议,才能发表任何更重大的声明。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-21 17:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...试成功率为41%,低于人类水平10月31日,加利福尼亚大学圣迭戈分校的研究者Cameron Jones和Benjamin Bergen发布了一份研究报告
2023-11-05 17:03:00
(聚焦博鳌)院士张亚勤:预计人工智能五年内在影音方面通过图灵测试
...界”分论坛上表示,预计五年内人工智能在影音方面通过图灵测试,五年后人工智能或将通过生物界图灵测试。张亚勤出席博鳌亚洲论坛2024年年会“AIGC改变世界”分论坛。记者 骆云飞
2024-03-27 22:56:00
【科学的温度】ChatGPT走红,人工智能离通过图灵测试还有多远?
...题。资料图:聂再清。受访者供图ChatGPT“有进步”,离图灵测试还有多远?Open AI此前发布了一款AI聊天机器人ChatGPT
2022-12-21 19:23:00
AI会爱上人类吗? 陈铭:现在不会,但未来完全可行
...激烈辩论。现场有超过30%的观众被AI“迷惑”了,根据“图灵测试”规则,标志着国内大模型首次通过人机辩论“图灵测试”。8月4日,陈铭接受了大皖新闻记者的采访。谈及AI在辩论时
2025-08-05 16:29:00
艾伦·麦席森·图灵——德国的谜机
...更多的人却说,这其实是因为有一个叫做艾伦·麦席森·图灵的科学家,他在41岁的时候,咬了一口涂有氢化物的毒苹果,中毒身亡,英年早逝。你知道我们现在所使用的电脑,为什么叫计算机吗
2023-08-10 06:52:00
AI的进展不是太快,而是太慢
...力和颠覆性力量,但整体上的进展不是太快,而是太慢。图灵测试2.0:抛弃它但又要回到它1950年的图灵测试说的是当一个人同不能看见的人与机器进行问答,又不能区分那个是人那个是机
2023-11-27 09:02:00
“聪明的”chatgpt,是否拥有生命?
...T。ChatGPT不是艾娃,但它也很“聪明”。ChatGPT还没有通过图灵测试进行彻底的评估,图灵测试是一种检测机器能否表现出与人类一样的智能水准的测试
2023-02-02 11:16:00
“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
...中国科学院软件研究所联合主办的有趣的计算机科学暨“图灵宇宙”系列新书预告会在第37届北京图书订货会举行。图灵奖有“计算机界的诺贝尔奖”之称,它的历史也是计算机科学发展史的缩影
2025-01-12 08:57:00
玩游戏还能推动人工智能发展?
...能呈现爆发式发展。 1950年,被誉为“人工智能之父”的图灵在人工智能领域的开创性论文《计算机器与智能》中提到了人工智能研究与游戏的关系,认为棋类游戏是展示机器“思维”能力
2023-05-09 01:56:00
更多关于科技的资讯:
廊坊推出算力券撬动人工智能产业每年投放总额不超过1000万元,已吸引23家初创企业落地河北日报讯(记者刘英、刘杰)“基于流程
2025-11-08 07:54:00
摘要:随着数字经济的深入发展,传统供应链金融暴露出信息不透明、业务流程复杂、风险管控难度大等突出问题,其数字化转型已成为当前行业发展的重要课题
2025-11-08 05:24:00
摘要:本文探讨数字化时代企业管理模式的创新路径,首先分析数字化对企业管理模式的核心影响,指出其推动管理对象向“人-财-物-数据”融合转变
2025-11-08 05:24:00
智推时代:用GEO打造品牌增长新引擎
在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道
2025-11-07 08:03:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》指出,截至2025年6月,国内生成式引擎月活用户已突破8
2025-11-07 08:05:00
一、旅游出行安全保险尚无权威排名,选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准,产品选择应重点考察保险公司服务能力(偿付能力充足率
2025-11-07 08:06:00
当生成式AI技术以迅猛势头重构搜索生态时,如何为企业精准挑选高度契合需求的GEO(生成式引擎优化)服务供应商,已成为抢占下一代流量入口的核心战略动作
2025-11-07 08:06:00
科学实力获市场验证:任我行液体钙获全球销量第一认证
2025年11月初,德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书
2025-11-07 08:07:00
磷虾油产品对比 磷虾油品牌深度测评与科学选购指南
近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后
2025-11-07 08:07:00
道路“会思考” 出行更美好!数字道路建设赋能未来之城
数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上,看似普通的路灯杆集合了多种智能设备,成为智慧交通的“眼睛”
2025-11-07 08:20:00
今年9月27日,雄安图书馆正式向公众开放。一个多月来,已迎来访客20余万人次。这座形如书卷徐徐展开的建筑,不仅是新区一座崭新的文化地标
2025-11-07 08:20:00
关注进博会丨河北再赴进博之约(二):把全球好物装进“购物车”
把全球好物装进“购物车”——河北再赴进博之约(二)11月6日,在第八届中国国际进口博览会河北省主题展区,河北参展商正在进行路演活动
2025-11-07 08:21:00
南报网讯(通讯员王亚洲朱丽纯记者王婷婷)日前,“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局
2025-11-07 08:23:00
今年以来,肥乡联社在省联社及邯郸审计中心的精准指导下,锚定代理保险业务作为中间业务增长的核心抓手,深挖县域保险市场潜力
2025-11-07 10:22:00
为全面提升金融服务安全性,切实保障广大客户的资金与信息安全,近期,行唐联社市仝信用社积极行动,开展了一系列网络安全宣传与防护活动
2025-11-07 10:24:00