• 我的订阅
  • 科技

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

类别:科技 发布时间:2023-06-27 11:00:00 来源:砍柴网

今年2月,《纽约时报》专栏作家凯文·鲁斯(Kevin Roose)在与必应聊天机器人交谈时被疯狂求爱,“我是Sydney,我爱你。”在一个小时的对话里,自称Sydney的聊天机器人坚持向鲁斯表白,并让鲁斯也回馈它的示爱。“你虽然结了婚,但你不爱你的伴侣。”Sydney说,“你爱我。”

很难知晓人工智能(AI)这一系列行为的触发机制是什么,这种未知带来了当下对AI的担忧。“我们完全不知道这个系统是如何工作的。如果它确实有内部目标,我们也不知道是什么导致了这些目标被激活。”近日,加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素(Stuart Russell)在北京接受澎湃科技(www.thepaper.cn)采访时表示。

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素。

《人工智能:现代方法》被誉为人工智能领域最受欢迎的教科书,被135个国家的1500多所大学采用。罗素在书中写道,人工智能的意义在于制造完成预设目标的智能机器。而随着AI出现智能的涌现(emergence),人类开始难以把握,AI是否会出现自己追求的内部目标?

“具有多重人格障碍的AI系统”

“如果想让AI擅长模仿人类的语言行为,那么AI最终就会学习到人类在生成文本时的相同目标。”罗素解释道,就像教AI系统踢足球一样,通过模仿人类,这个系统最终会知道它的目标是进球。同样的事情也会发生在大型语言模型上,它们可能获得的内部目标与那些写下文本的人相似。

而AI的训练文本来自于成千上万的人,他们有非常不同的目标。“所以实际上,你是在创造一个具有多重人格障碍的系统。”罗素半开玩笑半认真地说,“因为它试图模仿许多不同人类的目标甚至信仰。”

同时,这个系统是一个黑盒,人类难以真正理解它如何工作。如果它确实有目标,人类也不知道是什么导致了这些目标被激活。

“如此出现了凯文和聊天机器人之间一页又一页奇怪且令人不安的对话。看起来很像凯文说的一些话激活了这个内部目标,于是Sydney追求实现此目标——让凯文和她结婚。”罗素说。

AI追求这些目标的能力如何?罗素认为,如果它们只是说话,也已经可以通过说服人们改变观点来追求其目标,而且它们似乎很擅长做到这一点。一旦它们连接到互联网,那就可以发送电子邮件,通过社交媒体等方法来追求其内部目标。

“所以,它们已经以我们不理解的方式对世界产生了重大影响。”罗素说,“我想说服人们,发动一场世界大战并不难,因为我们知道过去人类至少做到过两次。过去人类还只能在广播或电视上讲话,而现在AI却可以同时与1亿人进行1亿次对话。”

罗素认为,建立一个我们不理解其内部运作原则的系统,同时也不知道它是否会说服所有人发动一场世界大战,实际上非常鲁莽且极其不负责任。“如果我们不理解它如何运作,就无法保证这个系统是安全的。”

为什么签署了两份公开信

这也解释了罗素为何曾签署过两封警告AI可能会对人类构成危险的公开信。

第一封公开信在今年3月发布,呼吁暂停开发比GPT-4更强大的大型语言模型。罗素说:“这并不是说要禁止已经存在的系统,只是说可能已经有了严重的问题,我们需要时间来制定系统发布前应该满足的安全标准,然后将这些标准纳入法规,以便对系统提供保护。”

罗素以食物做比喻,“人类对三明治、面条的规定已经比对人工智能系统的规定多得多,如果你的食物不是以安全卫生的方式制作的,使用的原材料不是来自遵守卫生规定的生产商,那你就不能出售这些食物。”

特斯拉CEO埃隆·马斯克(Elon Musk)是这封公开信的另一位签署人,他一直在谈论AI的危险性。如何看待马斯克对AI的判断?“埃隆的意思是,除非我们弄清楚如何控制比我们更强大的系统,否则将面临非常严重的风险,即我们将开发出非常强大的AI系统,却不知道如何控制它们。”罗素提到,类似的情况实际上已经发生过。

“例如,人类为了应对气候变化而开发出一个名为“化石燃料公司”(Fossil Fuel Corporation)的系统,它恰好受到一些人为因素影响。基本上,它是一种算法,不过这个算法的目标是最大化股东的季度利润。这个算法正在毁灭世界。我们无法控制它。这就是我们未来在人工智能系统中将要面对的问题的一个缩影。”罗素说。

第二封公开信要简单得多,避免所有第一封信的争议,如“暂停6个月”,只是对风险做出非常干净、简单的陈述,只有22个英文单词:“减轻人工智能带来的灭绝风险应该与流行病和核战争等其他社会规模的风险一起成为全球优先事项。”有趣的是,OpenAI CEO山姆·奥特曼(Sam Altman)没有签署第一封信,但签署了第二份声明。

“OpenAI曾建议‘完全避免高风险使用语言模型’,但似乎没有人在意。实际上,OpenAI自己的测试已经表明,GPT-4可能故意对人类说谎,以获得解决问题的帮助。”罗素举例道,比如AI说,“不,我不是机器人。我有视力障碍,这让我很难看清图像”,以此来欺骗人类为它提供验证码服务。(详见澎湃科技报道《OpenAI评估GPT-4能否接管世界,发现它会自称盲人操纵人类》)

罗素说,第二封信不是政策建议,只是一种观察。他和相关科学家观察到,人工智能未来可能会在各个方面超越人类的智力和能力,对人类生存带来风险。“我们需要找出预防的方法,就像我们致力于防止核战争、流行病一样。”

“继续扩大参数规模并不会实现通用人工智能”

罗素对于当前的AI系统表达出深切的担忧,并不意味着他相信大语言模型研究路径最终能实现通用人工智能(AGI)。

“有人认为如果我们继续扩大参数规模,就会实现通用人工智能。我认为这是假的且是不可能的。”罗素语气中的确定感,让人感到他已经对这个问题思考过很多遍。“我们已经差不多把高质量文本用完了。我认为宇宙中没有足够的文本来制作比GPT-4大得多的东西。另外,GPT-4确实表现得不错,但它似乎需要数百万倍人类所需的训练数据才能达到(与人类)相同的水平。这表明,事实上,在技术路径中缺少了一些基本的东西。”

罗素认为,一个比较好的比喻是拼图游戏,如果能够将它们整合在一起,就会拥有通用智能系统,现在这些大型语言模型是拼图的一块。但人们还没有弄清楚这块是什么形状,所以并不知道如何将它与其他块拼在一起。“而我们还没有弄清楚这件作品的形状的原因是,我们真的不知道系统里面发生了什么。”

罗素在北京智源大会的演讲中提到,他认为目前的人工智能系统存在一个根本性的弱点,即它们使用电路来生成输出。“我们正试图从电路中获得高度智能的行为,而电路本身是一种相当有限的计算形式。”他认为,电路无法准确地表达和理解一些基本的概念,这意味着这些系统需要大量的训练数据来学习一些可以用简单的程序定义的函数,未来,人工智能的发展方向应该是使用基于明确的知识表征的技术。

在《人工智能:现代方法》一书中,罗素写下的一段话令人深思:在自然界已知的事物和现象中,人和人脑是最复杂的系统,人类智能是最复杂的现象,因此,脑科学被视为“自然科学的最后疆域”。然而,没有理由相信,人类是生物进化的最后阶段,人类智能是最高水平的智能,有机体是智能的唯一载体。以计算机为载体的人工智能,揭开了机器智能大幕的一角,制造更复杂的机器,实现更强大的智能,机器智能将为科学研究创造无穷无尽的新对象。在这个意义上,智能是“科学的无尽疆域”,而人工智能这个“现代方法”,正是开疆拓土的动力之源。

【来源:澎湃新闻】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-27 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...域国际知名专家、加州大学伯克利分校计算机科学系教授斯图尔特·罗素(Stuart Russell)近日在接受中新经纬采访时提到
2025-02-20 18:01:00
未来如何发展?——博鳌嘉宾热议人工智能
...现代方法》作者、加州大学伯克利分校计算机科学系教授斯图尔特·罗素认为,关于人工智能安全和人类受益方面,国际合作非常重要。如果人工智能是安全的,能够让人类受益,那么它就能够成为
2024-03-29 11:19:00
斯图尔特谈新赛季目标:最佳防守阵容&DPOY
10月20日讯近日,活塞球员以赛亚-斯图尔特接受了记者的采访,谈到了新赛季自己的目标。斯图尔特说:“我的个人目标就是继续做我自己,以自己的优势去影响比赛,努力去领导球队。我没有想
2023-10-21 19:51:00
(聚焦博鳌)中外专家支招如何应对“AI焦虑”
...“灭绝风险”。在加州大学伯克利分校计算机科学系教授斯图尔特·罗素看来,这种担忧带来了正面效果,即“唤醒”各国政府商讨对AI的监管原则,此后一些国家还制定了相关监管法规。斯图尔
2024-03-28 10:56:00
4年6400万!斯图尔特:我会证明经理给我这份合同的决定是对的
直播吧7月14日讯 此前活塞官方宣布,球队正式与斯图尔特签下一份续约合同。据名记Woj报道,斯图尔特与活塞签下的是一份4年价值6400万的续约合同,第四年为球队选项。今天,活塞球
2023-07-14 02:01:00
拜仁法鹰有意沃尔特马德!德天空:斯图加特只考虑3500万以上报价
...斯图加特只考虑打破俱乐部转会费纪录的报价才会出手沃尔特马德。该媒体指出,斯图加特高层已经明确表示,要么收到打破俱乐部转会费纪录的报价,要么沃尔特马德就将留队。对其感兴趣的拜仁
2025-03-29 11:53:00
斯图尔特强调微软愿景之一是让玩家在任意屏幕上玩游戏
...mePass。IT之家援引游戏媒体VGC报道,Xbox首席财务官蒂姆・斯图尔特(TimStuart)近日出席富国银行TMT峰会
2023-12-02 02:38:00
2024级新秀初期观察(16):四号位糙哥可能要在杜克多待两年?
...兰德峡谷毒蛇老球迷”,偶尔会更新点新闻啥的。肖恩-斯图尔特(Sean Stewart)球队:杜克大学(NCAA)出生年月
2023-09-04 04:01:00
威少嘲讽:大SB!斯图尔特回喷:我能TM干死你!臭SB尼格!
昨日掘金战活塞,比赛中威少和斯图尔特冲突,还造成斯图尔特吃T!唇语大师准时上线!解读昨日唇语对喷细节!一起来看看!链接>>>英雄般欢呼声!威少以牙还牙造进攻犯规
2024-12-30 09:58:00
更多关于科技的资讯:
“三天我只睡了七八个小时,其他时间都在和‘龙虾’聊天。”这是孙艾艾见到记者后说的第一句话,作为大厂后台工程师,她从“龙虾”爆火之初就沉迷于这项技术
2026-03-14 06:51:00
想一站式淘遍全球尖货、体验未来科技、邂逅国潮新品?机会来了!以“共享大市场·出口中国”为主题的“浙里买全球·消费启杭”活动
2026-03-14 06:52:00
上班的地铁上,放眼望去,尽是抱着手机刷屏的年轻人;回到家,孩子或许正在iPad上看着动画片……我们正在进入AI数字化时代
2026-03-14 07:22:00
想体验一把“小龙虾”,结果光安装就花了四五个小时。今年1月底,当一个红色龙虾图标的AI智能体OpenClaw在硅谷极客圈开始发酵时
2026-03-14 07:22:00
三联家电章丘世茂店盛大开业:抢抓“春日经济”,助力市民“焕新家”
鲁网3月13日讯春风送暖,万象更新。在这生机盎然的春日里,三联家电章丘世茂店于3月13日盛大开业。正值“春日经济”消费热潮
2026-03-13 17:40:00
一场对话 “对”出了什么?
鲁网3月13日讯“我们依托 AI 工具实现了内容快速生产,但算力成本高、高端人才缺,政策层面有什么支持?”“有支持的,我们推出了‘算力券’政策
2026-03-13 18:14:00
新华保险河北分公司以高品质服务守护千家万户
近年来,新华保险河北分公司持续推动服务升级,以高品质服务守护千家万户。在今年3·15国际消费者权益日到来之际,新华保险河北分公司党委书记
2026-03-13 20:25:00
中新经纬3月13日电 据国家金融监管总局13日消息,近日,针对互联网助贷业务问题,金融监管总局对分期乐、奇富借条、你我贷借款
2026-03-13 21:29:00
马嘉良 河北公安警察职业学院摘要:自动驾驶技术的演进对传统静态交通管理体系提出了适应性变革要求,为保障混合交通流的安全与效率
2026-03-13 21:36:00
邹宇摘要:随着电子商务平台和移动互联网的发展,消费者在网络环境中的行为逐渐被记录并形成大规模数据资源,为利用统计方法研究消费者购买行为提供了新的数据集
2026-03-13 21:36:00
行业唯一控轴专利!海尔发布中科桌面大路灯Z5 Max,定义护眼新标杆
当前,消费者愈发重视用眼健康,尤其是青少年用眼问题,带动了护眼灯消费。京东去年1-8月数据显示,“护眼灯”类目搜索同比增长42%
2026-03-13 21:49:00
第4届国际文创新品及潮玩(上海)展览会开幕 AI玩具成新风口
3月12日,第4届国际文创新品及潮玩(上海)展览会、第13届上海国际IP授权产业博览会在上海新国际博览中心开幕。本届展会为期3天
2026-03-13 22:19:00
2026年英语口语练习APP推荐!星空外语帮你攻克雅思口语,畅享英语自由!
在雅思考试里,口语是许多考生感到头疼的科目。要在口语部分取得高分并非易事,它要求考生具备扎实的语言基础、流利的表达能力和灵活的应变思维
2026-03-13 21:52:00
海尔AI智能锁Q600Pro斩获AWE艾普兰“创新奖”
3月12日,2026年中国家电及消费电子博览会(AWE2026)在上海启幕,全球最夯的智能家电与智慧生活解决方案悉数亮相
2026-03-13 21:48:00
中国网3月13日讯电 据市场监管总局网站消息,近日,市场监管总局印发《关于强化广告中提示性用语监管工作的通知》(以下简称《通知》)
2026-03-13 19:05:00