• 我的订阅
  • 科技

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

类别:科技 发布时间:2023-06-27 11:00:00 来源:砍柴网

今年2月,《纽约时报》专栏作家凯文·鲁斯(Kevin Roose)在与必应聊天机器人交谈时被疯狂求爱,“我是Sydney,我爱你。”在一个小时的对话里,自称Sydney的聊天机器人坚持向鲁斯表白,并让鲁斯也回馈它的示爱。“你虽然结了婚,但你不爱你的伴侣。”Sydney说,“你爱我。”

很难知晓人工智能(AI)这一系列行为的触发机制是什么,这种未知带来了当下对AI的担忧。“我们完全不知道这个系统是如何工作的。如果它确实有内部目标,我们也不知道是什么导致了这些目标被激活。”近日,加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素(Stuart Russell)在北京接受澎湃科技(www.thepaper.cn)采访时表示。

对话斯图尔特·罗素:AI是否会出现自己追求的内部目标?

加州大学伯克利分校计算机科学教授、《人工智能:现代方法》作者斯图尔特·罗素。

《人工智能:现代方法》被誉为人工智能领域最受欢迎的教科书,被135个国家的1500多所大学采用。罗素在书中写道,人工智能的意义在于制造完成预设目标的智能机器。而随着AI出现智能的涌现(emergence),人类开始难以把握,AI是否会出现自己追求的内部目标?

“具有多重人格障碍的AI系统”

“如果想让AI擅长模仿人类的语言行为,那么AI最终就会学习到人类在生成文本时的相同目标。”罗素解释道,就像教AI系统踢足球一样,通过模仿人类,这个系统最终会知道它的目标是进球。同样的事情也会发生在大型语言模型上,它们可能获得的内部目标与那些写下文本的人相似。

而AI的训练文本来自于成千上万的人,他们有非常不同的目标。“所以实际上,你是在创造一个具有多重人格障碍的系统。”罗素半开玩笑半认真地说,“因为它试图模仿许多不同人类的目标甚至信仰。”

同时,这个系统是一个黑盒,人类难以真正理解它如何工作。如果它确实有目标,人类也不知道是什么导致了这些目标被激活。

“如此出现了凯文和聊天机器人之间一页又一页奇怪且令人不安的对话。看起来很像凯文说的一些话激活了这个内部目标,于是Sydney追求实现此目标——让凯文和她结婚。”罗素说。

AI追求这些目标的能力如何?罗素认为,如果它们只是说话,也已经可以通过说服人们改变观点来追求其目标,而且它们似乎很擅长做到这一点。一旦它们连接到互联网,那就可以发送电子邮件,通过社交媒体等方法来追求其内部目标。

“所以,它们已经以我们不理解的方式对世界产生了重大影响。”罗素说,“我想说服人们,发动一场世界大战并不难,因为我们知道过去人类至少做到过两次。过去人类还只能在广播或电视上讲话,而现在AI却可以同时与1亿人进行1亿次对话。”

罗素认为,建立一个我们不理解其内部运作原则的系统,同时也不知道它是否会说服所有人发动一场世界大战,实际上非常鲁莽且极其不负责任。“如果我们不理解它如何运作,就无法保证这个系统是安全的。”

为什么签署了两份公开信

这也解释了罗素为何曾签署过两封警告AI可能会对人类构成危险的公开信。

第一封公开信在今年3月发布,呼吁暂停开发比GPT-4更强大的大型语言模型。罗素说:“这并不是说要禁止已经存在的系统,只是说可能已经有了严重的问题,我们需要时间来制定系统发布前应该满足的安全标准,然后将这些标准纳入法规,以便对系统提供保护。”

罗素以食物做比喻,“人类对三明治、面条的规定已经比对人工智能系统的规定多得多,如果你的食物不是以安全卫生的方式制作的,使用的原材料不是来自遵守卫生规定的生产商,那你就不能出售这些食物。”

特斯拉CEO埃隆·马斯克(Elon Musk)是这封公开信的另一位签署人,他一直在谈论AI的危险性。如何看待马斯克对AI的判断?“埃隆的意思是,除非我们弄清楚如何控制比我们更强大的系统,否则将面临非常严重的风险,即我们将开发出非常强大的AI系统,却不知道如何控制它们。”罗素提到,类似的情况实际上已经发生过。

“例如,人类为了应对气候变化而开发出一个名为“化石燃料公司”(Fossil Fuel Corporation)的系统,它恰好受到一些人为因素影响。基本上,它是一种算法,不过这个算法的目标是最大化股东的季度利润。这个算法正在毁灭世界。我们无法控制它。这就是我们未来在人工智能系统中将要面对的问题的一个缩影。”罗素说。

第二封公开信要简单得多,避免所有第一封信的争议,如“暂停6个月”,只是对风险做出非常干净、简单的陈述,只有22个英文单词:“减轻人工智能带来的灭绝风险应该与流行病和核战争等其他社会规模的风险一起成为全球优先事项。”有趣的是,OpenAI CEO山姆·奥特曼(Sam Altman)没有签署第一封信,但签署了第二份声明。

“OpenAI曾建议‘完全避免高风险使用语言模型’,但似乎没有人在意。实际上,OpenAI自己的测试已经表明,GPT-4可能故意对人类说谎,以获得解决问题的帮助。”罗素举例道,比如AI说,“不,我不是机器人。我有视力障碍,这让我很难看清图像”,以此来欺骗人类为它提供验证码服务。(详见澎湃科技报道《OpenAI评估GPT-4能否接管世界,发现它会自称盲人操纵人类》)

罗素说,第二封信不是政策建议,只是一种观察。他和相关科学家观察到,人工智能未来可能会在各个方面超越人类的智力和能力,对人类生存带来风险。“我们需要找出预防的方法,就像我们致力于防止核战争、流行病一样。”

“继续扩大参数规模并不会实现通用人工智能”

罗素对于当前的AI系统表达出深切的担忧,并不意味着他相信大语言模型研究路径最终能实现通用人工智能(AGI)。

“有人认为如果我们继续扩大参数规模,就会实现通用人工智能。我认为这是假的且是不可能的。”罗素语气中的确定感,让人感到他已经对这个问题思考过很多遍。“我们已经差不多把高质量文本用完了。我认为宇宙中没有足够的文本来制作比GPT-4大得多的东西。另外,GPT-4确实表现得不错,但它似乎需要数百万倍人类所需的训练数据才能达到(与人类)相同的水平。这表明,事实上,在技术路径中缺少了一些基本的东西。”

罗素认为,一个比较好的比喻是拼图游戏,如果能够将它们整合在一起,就会拥有通用智能系统,现在这些大型语言模型是拼图的一块。但人们还没有弄清楚这块是什么形状,所以并不知道如何将它与其他块拼在一起。“而我们还没有弄清楚这件作品的形状的原因是,我们真的不知道系统里面发生了什么。”

罗素在北京智源大会的演讲中提到,他认为目前的人工智能系统存在一个根本性的弱点,即它们使用电路来生成输出。“我们正试图从电路中获得高度智能的行为,而电路本身是一种相当有限的计算形式。”他认为,电路无法准确地表达和理解一些基本的概念,这意味着这些系统需要大量的训练数据来学习一些可以用简单的程序定义的函数,未来,人工智能的发展方向应该是使用基于明确的知识表征的技术。

在《人工智能:现代方法》一书中,罗素写下的一段话令人深思:在自然界已知的事物和现象中,人和人脑是最复杂的系统,人类智能是最复杂的现象,因此,脑科学被视为“自然科学的最后疆域”。然而,没有理由相信,人类是生物进化的最后阶段,人类智能是最高水平的智能,有机体是智能的唯一载体。以计算机为载体的人工智能,揭开了机器智能大幕的一角,制造更复杂的机器,实现更强大的智能,机器智能将为科学研究创造无穷无尽的新对象。在这个意义上,智能是“科学的无尽疆域”,而人工智能这个“现代方法”,正是开疆拓土的动力之源。

【来源:澎湃新闻】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-27 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...域国际知名专家、加州大学伯克利分校计算机科学系教授斯图尔特·罗素(Stuart Russell)近日在接受中新经纬采访时提到
2025-02-20 18:01:00
未来如何发展?——博鳌嘉宾热议人工智能
...现代方法》作者、加州大学伯克利分校计算机科学系教授斯图尔特·罗素认为,关于人工智能安全和人类受益方面,国际合作非常重要。如果人工智能是安全的,能够让人类受益,那么它就能够成为
2024-03-29 11:19:00
斯图尔特谈新赛季目标:最佳防守阵容&DPOY
10月20日讯近日,活塞球员以赛亚-斯图尔特接受了记者的采访,谈到了新赛季自己的目标。斯图尔特说:“我的个人目标就是继续做我自己,以自己的优势去影响比赛,努力去领导球队。我没有想
2023-10-21 19:51:00
(聚焦博鳌)中外专家支招如何应对“AI焦虑”
...“灭绝风险”。在加州大学伯克利分校计算机科学系教授斯图尔特·罗素看来,这种担忧带来了正面效果,即“唤醒”各国政府商讨对AI的监管原则,此后一些国家还制定了相关监管法规。斯图尔
2024-03-28 10:56:00
4年6400万!斯图尔特:我会证明经理给我这份合同的决定是对的
直播吧7月14日讯 此前活塞官方宣布,球队正式与斯图尔特签下一份续约合同。据名记Woj报道,斯图尔特与活塞签下的是一份4年价值6400万的续约合同,第四年为球队选项。今天,活塞球
2023-07-14 02:01:00
拜仁法鹰有意沃尔特马德!德天空:斯图加特只考虑3500万以上报价
...斯图加特只考虑打破俱乐部转会费纪录的报价才会出手沃尔特马德。该媒体指出,斯图加特高层已经明确表示,要么收到打破俱乐部转会费纪录的报价,要么沃尔特马德就将留队。对其感兴趣的拜仁
2025-03-29 11:53:00
斯图尔特强调微软愿景之一是让玩家在任意屏幕上玩游戏
...mePass。IT之家援引游戏媒体VGC报道,Xbox首席财务官蒂姆・斯图尔特(TimStuart)近日出席富国银行TMT峰会
2023-12-02 02:38:00
2024级新秀初期观察(16):四号位糙哥可能要在杜克多待两年?
...兰德峡谷毒蛇老球迷”,偶尔会更新点新闻啥的。肖恩-斯图尔特(Sean Stewart)球队:杜克大学(NCAA)出生年月
2023-09-04 04:01:00
威少嘲讽:大SB!斯图尔特回喷:我能TM干死你!臭SB尼格!
昨日掘金战活塞,比赛中威少和斯图尔特冲突,还造成斯图尔特吃T!唇语大师准时上线!解读昨日唇语对喷细节!一起来看看!链接>>>英雄般欢呼声!威少以牙还牙造进攻犯规
2024-12-30 09:58:00
更多关于科技的资讯:
成都数字文创产业有了“定制化”保护服务
中国消费者报成都讯(记者刘铭)核心创意遭窃取、版权边界难界定、AIGC(人工智能生成内容)内容确权难……这些痛点困扰着数字文创企业的创新与发展
2026-01-16 11:01:00
全国首发垂直领域钢铁大模型有了升级版河钢发布钢铁行业全域大模型威赛博2.0河北日报讯(记者贡宪云)1月15日,河钢集团在唐山发布了钢铁行业全域大模型威赛博2
2026-01-16 08:15:00
高灯科技再登毕马威金融科技双50榜单!
近日,由雄安新区商务和投资促进局、雄安新区改革发展局等单位支持,毕马威主办的“毕马威金融科技企业双50榜单发布会”在雄安新区举行
2026-01-16 08:37:00
厦企布局AI玩具赛道 以人工智能技术赋能传统产业升级
麦明智能员工介绍AI数字梦工厂玩偶的功能。厦门网讯(文/厦门日报记者 林露虹 图/厦门日报记者 卢剑豪)毛茸茸的外表,圆滚滚的身子——刚走进软件园一期的厦门麦明智能科技有限公司
2026-01-16 08:51:00
临漳县“一品一播”云销“邺城优品”
图为临漳县“一品一播”企业样板直播间正在直播。河北新闻网讯(白增安、宋龙雨)后台订单实时跳动,打包区工作人员忙碌分拣……近日
2026-01-16 09:42:00
即时零售竞争升维,AI让“一句话点外卖”成为现实
于琛1月15日,阿里巴巴集团宣布将旗下人工智能(AI)应用程序“千问”接入其网络购物、旅游服务等业务生态,朝着打造“一站式AI平台”目标迈出了迄今为止的最大步伐
2026-01-16 10:38:00
郭海英中国出版协会、中国书刊发行业协会日前召开2026阅读X大会,会议发布的《2025年开卷图书零售市场趋势洞察报告》(简称《报告》)显示
2026-01-16 10:38:00
甘肃宏大在工业电子雷管核心工艺与智能化装配技术创新上迈出关键步伐
日前,工业和信息化部安全生产司对甘肃宏大下属平凉兴安“无药头快接式工业电子雷管工艺技术及智能兼容装配生产线研发项目”予以立项备案
2026-01-16 09:24:00
“帮我点23杯霸王茶姬的伯牙绝弦,其中12杯正常冰,8杯去冰,3杯热饮。”下午1点,杭州一互联网公司项目经理李薇打开千问App
2026-01-16 07:45:00
18年以后,齐金良仍会想起自己第一次看见那根采用日本技术和标准的预制管桩的情景。那时的他刚进入兆弟集团,也第一次接触到长十几米
2026-01-16 07:45:00
张锦涛 柳州工学院在现代建筑行业中,数字化技术的广泛应用正逐步改变传统的质量控制方式。通过将建筑工程的各个环节与数字化技术相结合
2026-01-16 07:06:00
中新经纬1月15日电 据“深圳市消费者委员会”微信号消息,近期,深圳市消委会开展儿童洞洞鞋比较试验,从线上、线下随机购买15款样品
2026-01-15 21:00:00
做完近视手术后,到底能不能看手机、电脑?划重点:可以看,但要讲“时机”和“方法”,盲目用眼可能会影响恢复哦!首先要明白
2026-01-15 22:13:00
依托自主研发的金融科技平台与线上化系统支撑,昆山农商银行成功推出“贵金属线上业务”及专属财富管理小程序,突破传统贵金属业务的地域与时间限制
2026-01-15 22:40:00
最高补贴1500元!家电、数码全都有,这份“省钱指南”请收好
大河网讯 近日,郑州航空港区正式启动2026年消费品以旧换新补贴活动,覆盖汽车、家电、数码智能产品三大领域,通过真金白银的补贴
2026-01-15 21:17:00