• 我的订阅
  • 科技

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

类别:科技 发布时间:2023-06-27 11:00:00 来源:砍柴网

今年2月,《纽约时报》专栏作家凯文·鲁斯(Kevin Roose)在与必应聊天机器人交谈时被疯狂求爱,“我是Sydney,我爱你。”在一个小时的对话里,自称Sydney的聊天机器人坚持向鲁斯表白,并让鲁斯也回馈它的示爱。“你虽然结了婚,但你不爱你的伴侣。”Sydney说,“你爱我。”

很难知晓人工智能(AI)这一系列行为的触发机制是什么,这种未知带来了当下对AI的担忧。“我们完全不知道这个系统是如何工作的。如果它确实有内部目标,我们也不知道是什么导致了这些目标被激活。”近日,加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素(Stuart Russell)在北京接受澎湃科技(www.thepaper.cn)采访时表示。

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素。

《人工智能:现代方法》被誉为人工智能领域最受欢迎的教科书,被135个国家的1500多所大学采用。罗素在书中写道,人工智能的意义在于制造完成预设目标的智能机器。而随着AI出现智能的涌现(emergence),人类开始难以把握,AI是否会出现自己追求的内部目标?

“具有多重人格障碍的AI系统”

“如果想让AI擅长模仿人类的语言行为,那么AI最终就会学习到人类在生成文本时的相同目标。”罗素解释道,就像教AI系统踢足球一样,通过模仿人类,这个系统最终会知道它的目标是进球。同样的事情也会发生在大型语言模型上,它们可能获得的内部目标与那些写下文本的人相似。

而AI的训练文本来自于成千上万的人,他们有非常不同的目标。“所以实际上,你是在创造一个具有多重人格障碍的系统。”罗素半开玩笑半认真地说,“因为它试图模仿许多不同人类的目标甚至信仰。”

同时,这个系统是一个黑盒,人类难以真正理解它如何工作。如果它确实有目标,人类也不知道是什么导致了这些目标被激活。

“如此出现了凯文和聊天机器人之间一页又一页奇怪且令人不安的对话。看起来很像凯文说的一些话激活了这个内部目标,于是Sydney追求实现此目标——让凯文和她结婚。”罗素说。

AI追求这些目标的能力如何?罗素认为,如果它们只是说话,也已经可以通过说服人们改变观点来追求其目标,而且它们似乎很擅长做到这一点。一旦它们连接到互联网,那就可以发送电子邮件,通过社交媒体等方法来追求其内部目标。

“所以,它们已经以我们不理解的方式对世界产生了重大影响。”罗素说,“我想说服人们,发动一场世界大战并不难,因为我们知道过去人类至少做到过两次。过去人类还只能在广播或电视上讲话,而现在AI却可以同时与1亿人进行1亿次对话。”

罗素认为,建立一个我们不理解其内部运作原则的系统,同时也不知道它是否会说服所有人发动一场世界大战,实际上非常鲁莽且极其不负责任。“如果我们不理解它如何运作,就无法保证这个系统是安全的。”

为什么签署了两份公开信

这也解释了罗素为何曾签署过两封警告AI可能会对人类构成危险的公开信。

第一封公开信在今年3月发布,呼吁暂停开发比GPT-4更强大的大型语言模型。罗素说:“这并不是说要禁止已经存在的系统,只是说可能已经有了严重的问题,我们需要时间来制定系统发布前应该满足的安全标准,然后将这些标准纳入法规,以便对系统提供保护。”

罗素以食物做比喻,“人类对三明治、面条的规定已经比对人工智能系统的规定多得多,如果你的食物不是以安全卫生的方式制作的,使用的原材料不是来自遵守卫生规定的生产商,那你就不能出售这些食物。”

特斯拉CEO埃隆·马斯克(Elon Musk)是这封公开信的另一位签署人,他一直在谈论AI的危险性。如何看待马斯克对AI的判断?“埃隆的意思是,除非我们弄清楚如何控制比我们更强大的系统,否则将面临非常严重的风险,即我们将开发出非常强大的AI系统,却不知道如何控制它们。”罗素提到,类似的情况实际上已经发生过。

“例如,人类为了应对气候变化而开发出一个名为“化石燃料公司”(Fossil Fuel Corporation)的系统,它恰好受到一些人为因素影响。基本上,它是一种算法,不过这个算法的目标是最大化股东的季度利润。这个算法正在毁灭世界。我们无法控制它。这就是我们未来在人工智能系统中将要面对的问题的一个缩影。”罗素说。

第二封公开信要简单得多,避免所有第一封信的争议,如“暂停6个月”,只是对风险做出非常干净、简单的陈述,只有22个英文单词:“减轻人工智能带来的灭绝风险应该与流行病和核战争等其他社会规模的风险一起成为全球优先事项。”有趣的是,OpenAI CEO山姆·奥特曼(Sam Altman)没有签署第一封信,但签署了第二份声明。

“OpenAI曾建议‘完全避免高风险使用语言模型’,但似乎没有人在意。实际上,OpenAI自己的测试已经表明,GPT-4可能故意对人类说谎,以获得解决问题的帮助。”罗素举例道,比如AI说,“不,我不是机器人。我有视力障碍,这让我很难看清图像”,以此来欺骗人类为它提供验证码服务。(详见澎湃科技报道《OpenAI评估GPT-4能否接管世界,发现它会自称盲人操纵人类》)

罗素说,第二封信不是政策建议,只是一种观察。他和相关科学家观察到,人工智能未来可能会在各个方面超越人类的智力和能力,对人类生存带来风险。“我们需要找出预防的方法,就像我们致力于防止核战争、流行病一样。”

“继续扩大参数规模并不会实现通用人工智能”

罗素对于当前的AI系统表达出深切的担忧,并不意味着他相信大语言模型研究路径最终能实现通用人工智能(AGI)。

“有人认为如果我们继续扩大参数规模,就会实现通用人工智能。我认为这是假的且是不可能的。”罗素语气中的确定感,让人感到他已经对这个问题思考过很多遍。“我们已经差不多把高质量文本用完了。我认为宇宙中没有足够的文本来制作比GPT-4大得多的东西。另外,GPT-4确实表现得不错,但它似乎需要数百万倍人类所需的训练数据才能达到(与人类)相同的水平。这表明,事实上,在技术路径中缺少了一些基本的东西。”

罗素认为,一个比较好的比喻是拼图游戏,如果能够将它们整合在一起,就会拥有通用智能系统,现在这些大型语言模型是拼图的一块。但人们还没有弄清楚这块是什么形状,所以并不知道如何将它与其他块拼在一起。“而我们还没有弄清楚这件作品的形状的原因是,我们真的不知道系统里面发生了什么。”

罗素在北京智源大会的演讲中提到,他认为目前的人工智能系统存在一个根本性的弱点,即它们使用电路来生成输出。“我们正试图从电路中获得高度智能的行为,而电路本身是一种相当有限的计算形式。”他认为,电路无法准确地表达和理解一些基本的概念,这意味着这些系统需要大量的训练数据来学习一些可以用简单的程序定义的函数,未来,人工智能的发展方向应该是使用基于明确的知识表征的技术。

在《人工智能:现代方法》一书中,罗素写下的一段话令人深思:在自然界已知的事物和现象中,人和人脑是最复杂的系统,人类智能是最复杂的现象,因此,脑科学被视为“自然科学的最后疆域”。然而,没有理由相信,人类是生物进化的最后阶段,人类智能是最高水平的智能,有机体是智能的唯一载体。以计算机为载体的人工智能,揭开了机器智能大幕的一角,制造更复杂的机器,实现更强大的智能,机器智能将为科学研究创造无穷无尽的新对象。在这个意义上,智能是“科学的无尽疆域”,而人工智能这个“现代方法”,正是开疆拓土的动力之源。

【来源:澎湃新闻】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-27 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...域国际知名专家、加州大学伯克利分校计算机科学系教授斯图尔特·罗素(Stuart Russell)近日在接受中新经纬采访时提到
2025-02-20 18:01:00
未来如何发展?——博鳌嘉宾热议人工智能
...现代方法》作者、加州大学伯克利分校计算机科学系教授斯图尔特·罗素认为,关于人工智能安全和人类受益方面,国际合作非常重要。如果人工智能是安全的,能够让人类受益,那么它就能够成为
2024-03-29 11:19:00
斯图尔特谈新赛季目标:最佳防守阵容&DPOY
10月20日讯近日,活塞球员以赛亚-斯图尔特接受了记者的采访,谈到了新赛季自己的目标。斯图尔特说:“我的个人目标就是继续做我自己,以自己的优势去影响比赛,努力去领导球队。我没有想
2023-10-21 19:51:00
(聚焦博鳌)中外专家支招如何应对“AI焦虑”
...“灭绝风险”。在加州大学伯克利分校计算机科学系教授斯图尔特·罗素看来,这种担忧带来了正面效果,即“唤醒”各国政府商讨对AI的监管原则,此后一些国家还制定了相关监管法规。斯图尔
2024-03-28 10:56:00
4年6400万!斯图尔特:我会证明经理给我这份合同的决定是对的
直播吧7月14日讯 此前活塞官方宣布,球队正式与斯图尔特签下一份续约合同。据名记Woj报道,斯图尔特与活塞签下的是一份4年价值6400万的续约合同,第四年为球队选项。今天,活塞球
2023-07-14 02:01:00
拜仁法鹰有意沃尔特马德!德天空:斯图加特只考虑3500万以上报价
...斯图加特只考虑打破俱乐部转会费纪录的报价才会出手沃尔特马德。该媒体指出,斯图加特高层已经明确表示,要么收到打破俱乐部转会费纪录的报价,要么沃尔特马德就将留队。对其感兴趣的拜仁
2025-03-29 11:53:00
斯图尔特强调微软愿景之一是让玩家在任意屏幕上玩游戏
...mePass。IT之家援引游戏媒体VGC报道,Xbox首席财务官蒂姆・斯图尔特(TimStuart)近日出席富国银行TMT峰会
2023-12-02 02:38:00
2024级新秀初期观察(16):四号位糙哥可能要在杜克多待两年?
...兰德峡谷毒蛇老球迷”,偶尔会更新点新闻啥的。肖恩-斯图尔特(Sean Stewart)球队:杜克大学(NCAA)出生年月
2023-09-04 04:01:00
威少嘲讽:大SB!斯图尔特回喷:我能TM干死你!臭SB尼格!
昨日掘金战活塞,比赛中威少和斯图尔特冲突,还造成斯图尔特吃T!唇语大师准时上线!解读昨日唇语对喷细节!一起来看看!链接>>>英雄般欢呼声!威少以牙还牙造进攻犯规
2024-12-30 09:58:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 应洁)马年新春将至,集美区年味渐浓。2月6日,由集美区商务局主办的“2026集美欢乐购”新春消费券正式“开抢”
2026-02-07 08:49:00
老人也能轻松操作!海尔智家APP“AI语音”让服务零门槛
智能家电功能日益丰富,售后环节的复杂化却成了很多用户的“数字门槛”。在智慧家庭战略指导下,海尔智家APP推出“AI语音”功能
2026-02-07 10:07:00
海尔智家APP“3D家庭视图”将操作效率提升60%
当智能家电数量不断增加,如何高效、直观地管理成了很多用户的“甜蜜负担”。海尔智家APP在智慧家庭战略指引下,通过数字孪生技术打造“3D家庭视图”功能
2026-02-07 10:09:00
从套购到套系,海尔智家靠近用户实现双第一
1月29日,中国家用电器服务维修协会发布《2026年家电服务业及新兴市场发展趋势预测》。报告指出,全屋智能和AI技术正成为推动市场增长的重要力量
2026-02-07 10:10:00
近日,中国科学技术大学的潘建伟院士团队在量子网络领域取得重要突破,首次构建出可扩展量子中继的基本模块,并在此基础上首次将设备无关量子密钥分发的传输距离突破百公里
2026-02-07 10:52:00
大皖新闻讯 近年来,安徽首创金融支持科创企业“共同成长计划”和“贷投批量联动”模式,科技型企业贷款4年连跨7个千亿台阶
2026-02-07 08:44:00
今天,“浙江第一摩天轮”——“天目之心”将在临安天目未来谷正式开转。“天目之心”摩天轮高131.4米,寓意“一生一世”的浪漫
2026-02-07 07:28:00
纵览原创|河北首家SUPER MINISO来了!石家庄 “首店经济”再添消费新场景
记者宋瑶 见习记者杨思涵2月6日,名创优品旗下SUPER MINISO超级名创河北首店在石家庄核心商圈中山路北国商城负一层正式开业
2026-02-07 07:33:00
河北日报讯(见习记者康晓博)2月4日,“AI+机器人”领域领军企业北京极智嘉科技股份有限公司(以下简称“极智嘉”)在雄安新区举行总部揭牌仪式
2026-02-07 07:39:00
邦德激光正式入驻Dream Park全球总部基地
近日,邦德激光总部员工全部迁入位于济南市历城区春晖路3999号的Dream Park全球总部基地,标志着公司发展进入全新阶段
2026-02-06 20:50:00
2026年WGS世界政府峰会 迪拜王储乘坐百度萝卜快跑无人车参会!
“解放双手、未来已来!”在体验完萝卜快跑全无人驾驶后,迪拜王储谢赫·哈姆丹主动在海外社交媒体上发文,赞叹这次“非常丝滑”的未来出行
2026-02-06 17:08:00
三联家电章丘首店世茂店盛大开业,一站式高端家电消费新升级
鲁网2月6日讯春启新程,盛境绽放!2月6日,扎根齐鲁四十一载的山东家电零售领军品牌三联家电,携章丘区域首店正式入驻章丘世茂广场
2026-02-06 17:12:00
造谣一张嘴,辟谣跑断腿。一段时间以来,网络“黑嘴”伤企现象时有发生,严重影响企业正常发展。现摘编山东青岛市网信办文章《守护营商网络净土
2026-02-06 17:46:00
蚂蚁集团发布《2025年消费者权益保护年报》:金融普惠教育系列行动覆盖2.4亿人次
中国消费者报报道(记者司宇萌)日前,蚂蚁集团正式发布《2025年消费者权益保护年报》(以下简称《年报》)。《年报》显示
2026-02-06 18:11:00