• 我的订阅
  • 科技

“人机对齐”:人类文明又到“生死时刻”?

类别:科技 发布时间:2024-02-18 06:23:00 来源:每日看点快看

本文转自:文汇报

“人机对齐”:人类文明又到“生死时刻”?

《人机对齐∶如何让人工智能学习人类价值观》 [美]布莱恩·克里斯汀 著唐璐译 湖南科学技术出版社出版

“人机对齐”:人类文明又到“生死时刻”?

图源:视觉中国 ■唐山

多伦多大学经济学家甘斯希望女儿能照顾小弟弟上厕所,他想出一个“好办法”:每帮小弟弟上一次厕所,女儿可得一块糖果。女儿很快找到窍门:不断给小弟弟喂水,让他多上厕所,以得到更多糖果……

甘斯遭遇了典型的“对齐问题”:行动与目标不统一,“需要A却奖励了B”。

在人类史上,“对齐问题”一次次带来困扰,随着人工智能(以下简写为AI)出现,“人机对齐”成了难题——AI可打败世界上最好的棋手,我们却不知它是如何做到的。随着人类越来越依赖AI,风险真地可控吗?我们会不会落入科幻短片《战争的最后一天》里的悲惨境地(人类灭绝,AI仍在自动作战)?

《人机对齐》是一本不太好读的书,全书分三篇,即“预警”“自主”与“示范”,彼此关联不大,甚至同篇各章间的逻辑关系亦不明显。或因本书旨趣不在于说明“AI已发展到什么地步”,而在于由此引发的思考。

从这个意义看,《人机对齐》不只是科普书,更是通识书,人人都有阅读它的必要,它应成为现代常识的组成部分——不了解这些常识,你会被现代社会“开除”。

不是技术问题,而是社会问题

玩家知道,所有电子游戏都有“暗关”。比如玩《魂斗罗》,可反复打较低级的关,刷分换武器,则过难关会更容易;再如老版《FIFA》,下底传中必进,借此大招,操纵中国队也能拿世界杯……许多“暗关”来自设计失误,不论程序员们怎样小心,也无法完全避免类似失误。

随着AI发展,失误变得越来越不可容忍。

2015年,来自海地的网络开发者阿尔西内利用谷歌照片软件,在网上分享了自己和亲友的照片,让阿尔西内震惊的是,他们的照片竟被归类为“大猩猩”。谷歌的技术团队迅速响应,可几个小时后,问题依旧,谷歌只好关闭了“大猩猩”这个标签。直到三年后,用谷歌搜大猩猩,仍看不到任何一张照片。

软件是怎么“学会”种族主义的?实际上,技术错误从来不只是技术本身的问题。19世纪照相最多的美国人不是林肯、格兰特,而是弗雷德里克·道格拉斯,一位废奴主义者,他发现,照片上的黑人特别难看,因胶片均依白人模特校准,形成化学配方,拍出的黑人则千人一面。

解决该问题似乎不难,多找黑人模特即可。同理,增加黑人照片,谷歌软件的识别率会更准确。

然而,结果适得其反:IBM用AI开发了招聘软件,输入100份简历,选出5份最好的——几乎都是男性。程序员关闭了性别选项,却无法改变结果。因为AI会通过关联信息,自动将女性排除。比如,它会把“上一年没有工作”的简历标注为不合格,于是所有刚生育的女性均遭拒。类似的标签无所不在,改不胜改。程序员们最后发现,他们面对的不是技术问题,而是社会问题——人类社会处处都有性别标签,通过这些标签,女性总会被辨认出来,被视为缺乏竞争力者。单靠技术,已无法解决。

无法突破的“不可能性原理”

上世纪80年代,美国司法开始用AI判断囚犯可否假释,2000年时,已有26个州如此进行。研究者发现了其中漏洞:黑人初犯者被评为高风险,但他们不再犯罪的可能性是白人的两倍,白人初犯者反而被评为低风险。

这一发现引发舆情激荡,人们纷纷要求去掉该系统的种族标签,结果却发现,落入IBM招聘系统一样的困境——假释系统会通过其他标签,重新进行种族筛选,但如把相关标签全撤掉,AI又会失去判断能力。

研究者们发现,一切判断都存在着“不可能性原理”,这在数学上得到了证明:没有标签,就不可能做判断;有标签,又必然有偏见,“原则上,任何风险评分天生都会被批评为有偏见”。

AI开发无法绕过两大难题:

首先,道德无法客观化。道德选择没有固定标准,会随情境的改变而变,人类常常无法回答“什么是真正重要的”,AI更做不到。

其次,精准预测无法减少风险。人类喜欢更精准的预测,从而掉进“预测陷阱”,事实上,造成结果的原因是多元的,预测再精准,也无法影响结果。美国芝加哥市曾列“危险拥枪者”名单,据说他们比其他人死于凶杀案的比例高232倍,即使如此,他们被枪杀的概率也仅有0.7%,如何从1000人中找到这7个人呢?折腾1000人,真能挽救这7个人?在《反对预测》中,作者哈科特写道:男司机易出事故,可是严查男司机,会鼓励女司机变得更鲁莽,车祸率并未下降。

不给答案,因为根本给不出答案

AI模仿了人脑的工作方式,通过大量案例训练,总结出“经验”,获得判断力。可这些“经验”正确吗?比如一款AI诊病软件,研究者惊讶地发现,它得出的“经验”是:肺病患者如有哮喘病,属低风险。胸痛有好处。

心脏病有好处。

超过100岁有好处。

这些逆天的“经验”,可能来自相关患者属高风险,会被特殊照顾,但AI不知全过程,只知他们经特殊照顾后,痊愈率较高,便认定“有好处”。

AI的大多数“错误经验”之所以不可知,是因为它模仿了人类的神经系统,作为人类,我们自己也不知自己有多少“错误经验”,以及它们形成的原理。通过可视化技术,研究者们发现,AI的底层充满荒谬。

比如判断“什么是哑铃”,AI会把手臂、肉色的、超现实的图案都算成哑铃,试错后,这些“经验”被否定,但并没消失,而是滞留在底层。人类会情绪失控,我们能模糊地感到,这与底层“经验”相关,那么“把哑铃误认作手臂”会不会带来长期影响?

AI正深入生活的方方面面,自动驾驶、医疗、城市管理、战争……谁能保证AI的底层经验不犯错?人类从没真正掌控好自我,引发一次次灾难,我们真能掌控好AI吗?

本书第二篇、第三篇将焦点转向AI发展史,描述了研究者们的突破历程,包括从单任务转向多任务,用单一AI在不同游戏中取胜;从外部激励转向AI自我激励;通过模仿、逆强化学习等,使AI更强大……

然而,更强大的AI不等于“人机对齐”,AI实际上在“强制执行自己有局限的理解”,它的目的未必是人类的目的。

当然,在牛津大学教授博斯特罗姆等激进进化主义者看来,这些都不是问题。他计算出,未来星际文明非常强大,今天耽误的每一秒,都相当于失去将来的100万亿人的生命,每向未来世界前进1%,都等于技术加速1000万年。因此即使AI有风险,也应全力推动。

研究者施莱格里斯则说:“如果有一个神奇的按钮,可以把人类变成一样的为幸福而优化的笨蛋,他们会按下它……几年前,我也鼓吹这样做。”但现在,他的看法改变了:“我认为不应该按那个按钮。”

对此,《人机对齐》没给出答案,因为根本给不出答案。

我们乃至历史,也许都是“AI”

虽然本书用大量篇幅在讲述AI发展的细节,但我更喜欢的,还是书中的“跑题”部分——为强化AI,研究者深入研究了人类自身智能的产生过程,得出的见解振聋发聩:我们每个人可能都是世界训练出来的“AI”。

人类拥有智能,源头是趋利避害的本能,在多巴胺的简单奖励下,塑造出复杂行为——并不是做对了,多巴胺才奖励快感,而是做新奇的事时,多巴胺才会给奖励。

所以,人类喜欢刺激、冒险和挑战。不断尝试,就有了更多试错机会,通过试错,人类智能得以成长。人类生活的世界就是“有效的课程”,它像一个大型游戏。这就可以理解,为什么电子游戏让人难以自拔,因为它比现实世界的奖励更直接。

在现实世界中,人在进化,决定成败的核心因素,是“奖励的稀疏性”。比如为了让人类学会飞,让人从悬崖往下跳,不会飞便摔死——这并非聪明的办法。在会飞与不会飞之间,有无数环节,如在每个环节都设置奖励,人类最终就能学会飞;如奖励太稀疏,从不会飞直接跨越到飞,必然失败。正如眼睛,是经四五十次进化才完成的。在书中,一位学者开玩笑说,要么让自己的孩子学会中文,要么就不给饭吃,孩子的母亲明智地拒绝了这个建议。

作者本想说明研究者通过改变稀疏性,提高AI能力,却给读者一个全新的看世界的视角:人类文明的本质就是一个奖励结构的故事。沿着这一思路,我们会推演出一个完全不同于以往“思想——行动——改变”的历史解释的结论,推动进步的力量是多元的,不论个体,还是群体,都沿着稀疏性向密集的方向发展,决定历史的关键因是稀疏性,而非想法、技术、制度或人物。

由此带来新的认知危机:如果人是受造物,那么自由是什么?

在书中,著名思想史学者斯金纳指出,在稀疏性面前,人与老鼠相同。当记者问他:“自由意志还有位置吗?”斯金纳回答:“它还有虚构的位置。”哪怕只为与这句话相遇,《人机对齐》就值得一读。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-18 08:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

协商与校准:与人工智能共存的未来
...人类的绝大部分行为都产生重要影响。而大部分人工智能研究者并不知道如何将非理性的部分植入到人工智能中,或者直接忽视了这部分。自然主义的观点虽然认识到了非理性,比如情绪等的重要性
2023-06-08 05:28:00
AI武器的“奥本海默时刻”?
...业模式有望重塑美国国防工业。不过,拉基的理念与不少研究者背道而驰。这不禁让人想起2017年美国加州大学伯克利分校计算机科学系教授斯图尔特·拉塞尔制作的“杀戮机器人”视频。该视
2024-05-13 09:57:00
数亿年前的人造物被发现,是谁留下来的?研究者:人类需警惕
有观点认为,地球上的文明是一个轮回,甚至可能不止是地球上的文明,其它星球上的文明也是如此,这或许也是一直到今天,都不曾有外星文明到访太阳系的根本原因。因为可能文明发展到一定阶段后
2022-12-26 07:00:00
江南观察|MCP协议赋能人机协同研究新机遇
...I)的高度,AI起伏不定的幻觉特征与驳杂表现,也让一些研究者心存疑虑。模型上下文协议(Model Context Protocol
2025-04-22 21:52:00
地球内部还有其他智慧生物?巴西发现神秘隧道,建造者不是人类
...个人类的脚印。这些贯穿地球演化史的神秘物,也让很多研究者怀疑,人类可能并不是地球上唯一的智慧生物,有一种可能性是:除了人类之外,地球上可能还有过其他智慧生物的存在。真的有史前
2022-12-25 05:00:00
3万年前的人类遗骸被发现,竟做过截肢手术,难道猿人也有智慧?
虽然主流科学界并不认同,但是,却仍有不少研究者相信,在地球40多亿年的演化史中,是存在过“史前文明”的,在这些研究者看来,地球文明是一个轮回,当文明发展到某一阶段后,就会走向灭亡
2024-09-02 13:39:00
太平洋海底发现整齐铺好的“黄砖路”,是史前遗迹还是自然形成?
...列规律,那就不可能是自然界随便摆摆石头那么简单。有研究者认为,这可能是一种叫做“柱状节理”的自然现象,是由于熔岩冷却时产生的应力导致裂缝发生规律性分布,从而形成类似于砖块的结
2024-09-21 10:44:00
DeepSeek好像在塑造一种新型依恋关系
...看人们是否会从所谓的「数字同理心」中受益。一开始,研究者让他们打分,大多数测试者表示,他们并没有从朋友和亲人那里感受到多少温暖和共情,也不指望一款应用能够带来,因为认为:科技
2025-02-28 09:12:00
奇葩实验揭秘!科学家为研究性行为而做了哪些匪夷所思实验?
...为来推测人类的特性呢?这是一个颇具争议的话题,一些研究者认为,通过观察动物的交配行为可以揭示出人类的某些特征,而另一些人则持不同意见。无论如何,我们不妨来看一看这个奇葩实验。
2024-01-08 09:47:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦)春节即将到来,我市开启“有奖发票”活动。2026年2月10日起,参与活动的消费者,最高可以获800元幸运奖金
2026-02-11 08:53:00
厦门:微米级工艺助力高端制造产业补链强链
厦门网讯(厦门日报记者 林岑)6日,鹭岛暖意融融,最高气温攀升至25℃。在位于海沧区的达昊精密零部件智慧工厂项目工地,建设热潮与春日气温同频升腾
2026-02-11 08:53:00
走企 | 艾拓自动化:为全球船舶装上“智能护航系统”
“产业炬光灯”系列短视频聚焦艾拓自动化,解锁从“零产品应用”到“行业引领”的成长密码。扫码看视频厦门网讯(厦门日报记者 李晓平)在茫茫大海上
2026-02-11 08:53:00
近期AI眼镜概念受事件催化:一是雷鸟创新携AI+AR眼镜亮相米兰冬奥会,获国际认可;二是国家以旧换新补贴政策首次将智能眼镜纳入补贴目录
2026-02-11 09:53:00
世界首台第六代COFE+机器人咖啡馆亮相2026人大会议,一杯“聪明咖啡”展示科技硬核
上海世博中心,2026年2月3日电 上午9时,上海市第十六届人民代表大会第四次会议在上海世博中心隆重开幕。在庄严的会场内外
2026-02-11 10:28:00
产学研协同攻坚 科研成果走向“生产线”每日商报讯 假期临近,浙江理工大学的纺织实验室仪器却低鸣不断,发出“滋滋”的运转声
2026-02-11 07:19:00
近日,字节跳动推出的AI视频生成模型Seedance2.0在海内外互联网上再度刷屏。据官方介绍,该模型能够根据文本或图像生成电影级视频
2026-02-10 23:41:00
江南时报讯 近日,苏州农商银行与人保财险苏州市分公司深化协同,成功落地全国首单银保合作“科创贷”。该企业作为国家级高新技术企业
2026-02-10 21:42:00
西秀食品“双星”冲刺首季“开门红”
连日来,位于西秀区的贵州安顺云鹫食品有限公司和贵州好味达食品有限公司呈现一派热火朝天的生产景象。作为本土食品行业的标杆企业
2026-02-10 22:10:00
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00