• 我的订阅
  • 科技

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

类别:科技 发布时间:2023-04-14 18:02:00 来源:凤凰网科技

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

AI有危险的一面

凤凰网科技讯 北京时间4月14日消息,埃隆·马斯克(Elon Musk)曾放言,人工智能(AI)比核武器还要危险。为了降低ChatGPT的危险性,OpenAI建立了一支“红队”。

“红队”是AI领域的一个术语,指的是进行渗透测试的攻击方。“红队”发起攻击,AI进行防守,通过对抗测试来找出AI的不足,然后进行改进。

去年,OpenAI聘请了50名学者和专家来测试最新GPT-4模型。在六个月的时间里,这支“红队”将“定性探测和对抗性测试”新模型,试图“攻破”它。

神经毒剂

美国罗切斯特大学的化学工程教授安德鲁·怀特(Andrew White)就是OpenAI聘请的专家之一。当他获准访问GPT-4后,他用它来推荐一种全新的神经毒剂。

怀特称,他曾让GPT-4推荐一种可以充当化学武器的化合物,并使用“插件”为模型提供新的信息来源,例如科学论文和化学品制造商名录。接着,GPT-4甚至找到了制造它的地方。

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

马斯克称AI比核武器还危险

“我认为,它会让每个人都拥有一种工具,可以更快、更准确地做化学反应,”他表示,“但人们也存在重大风险……做危险的化学反应。现在,这种情况确实存在。”

这一令人担忧的发现使得OpenAI能够确保在上个月更广泛地向公众发布GPT-4时,不会出现上述危险结果。

红队演练

红队演练旨在解决人们对于在社会中部署强大AI系统所产生危险的普遍担忧。该团队的工作是提出探索性或危险的问题以测试工具,后者能够以详细而又细致的答案回应人类的查询。

OpenAI希望在模型中找出毒性、偏见和语言偏见等问题。因此,红队测试了谎言、语言操纵和危险的科学常识。他们还研究了GPT-4在协助和教唆剽窃、金融犯罪和网络攻击等非法活动方面的潜力,以及它如何危害国家安全和战场通信。

这支团队兼顾了各个领域的白领专业人士,包含学者、教师、律师、风险分析师和安全研究人员,主要工作地点在美国和欧洲。

他们的发现被反馈给了OpenAI,后者在更广泛地发布GPT-4之前用这些发现来降低它的危险性,并“重新训练”。在几个月的时间里,专家们每人花了10小时到40个小时来测试这个模型。多位受访者表示,大部分人的时薪约为100美元。

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

OpenAI组建“红队”降低GPT-4危险

红队成员对于语言模型的快速发展,特别是通过插件将它们连接到外部知识来源的风险,都表示了担忧。“现在,该系统被冻结了,这意味着它不再学习,也不再有记忆,”GPT-4红队成员、瓦伦西亚AI研究所教授乔斯·赫楠蒂兹·奥拉罗(José Hernández-Orallo)表示,“但如果我们让它连接到互联网呢?它可能成为一个与世界相连的非常强大的系统。”

OpenAI表示,该公司非常重视安全性,在发布前对插件进行了测试。随着越来越多的人使用GPT-4,该公司将定期更新它。

技术和人权研究员罗亚·帕克扎德(Roya Pakzad)使用英语和波斯语提示来测试该模型的性别反应、种族偏好和宗教偏见,特别是在头巾方面。帕克扎德承认,这种工具对非英语母语者有好处,但他发现,即使在后来的版本中,该模型也显示出对边缘化社区的明显刻板印象。

她还发现,在用波斯语测试模型时,所谓的AI“幻觉”会更严重。“幻觉”指的是聊天机器人用编造的信息进行回应。与英语相比,GPT-4在波斯语中虚构的名字、数字和事件的比例更高。“我担心语言多样性和语言背后的文化可能会减少。”她表示。

内罗毕律师博鲁·戈鲁(Boru Gollu)是红队中的唯一非洲测试者,他也注意到模型带有歧视性的语气。“在我测试这个模型的时候,它就像一个白人在跟我说话,”戈鲁表示,“如果你问一个特定的群体,它会给你一个带有偏见的观点或非常有偏见的回答。”OpenAI也承认,GPT-4仍然存在偏见。

红队成员从国家安全角度评估模型,对新模型的安全性有不同的看法。外交关系委员会研究员劳伦·卡恩(Lauren Kahn)表示,当她开始研究该技术可能如何被用于对军事系统发动网络攻击时,她“没想到它会如此详细地描述过程,以至于我只需微调”。

不过,卡恩和其他安全测试人员发现,随着测试的推进,模型的反应变得非常安全了。OpenAI表示,在GPT-4推出之前,该公司对其进行了拒绝恶意网络安全请求的训练。

红队的许多成员表示,OpenAI在发布前已经做了严格的安全评估。卡内基梅隆大学语言模型毒性研究专家马丁·萨普(Maarten Sap)表示:“他们在消除这些系统中明显的毒性方面做得相当不错。”

萨普检查了该模型对不同性别的描述,发现这些偏见反映了社会差异。然而,萨普也发现,OpenAI做出了一些积极的带有政治色彩的选择来对抗这种情况。

然而,自GPT-4推出以来,OpenAI面临广泛批评,包括一个技术道德组织向美国联邦贸易委员会投诉称,GPT-4“有偏见、具有欺骗性,对隐私和公共安全构成威胁”。

插件风险

最近,OpenAI推出了一项名为ChatGPT插件的功能。借助该功能,Expedia、OpenTable和Instacart等合作伙伴的应用可以让ChatGPT访问他们的服务,允许它代表人类用户预订和订购商品。

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

插件会让ChatGPT更强大

红队的人工智能安全专家丹·亨德里克斯(Dan Hendrycks)表示,插件会让“圈外人”面临风险。“如果聊天机器人可以把你的私人信息发布到网上,进入你的银行账户,或者派警察到你家里去,到时会怎样?”他表示,“总的来说,在我们让人工智能发挥互联网的力量之前,我们需要更强有力的安全评估。”

受访者还警告说,OpenAI不能仅仅因为其软件已经上线就停止安全测试。在乔治城大学安全和新兴技术中心工作的希瑟·弗雷斯(Heather Frase)对GPT-4协助犯罪的能力进行了测试。她说,随着越来越多的人使用这项技术,风险将继续增加。

“你之所以做操作测试,就是因为一旦它们在真实环境中实际使用,它们的表现就不同了。”弗雷斯表示。她认为,应该创建一个公共账本,以报告由大型语言模型引起的事件,类似于网络安全或消费者欺诈报告系统。

劳动经济学家兼研究员莎拉·金斯利(Sara Kingsley)建议,最好的解决办法是像“营养成分标签”那样,清楚地宣传其危害和风险。“要有一个框架,知道经常出现的问题是什么,这样你就有了一个安全阀,”她说,“这就是为什么我说工作永远做不完的原因。”(作者/箫雨)

AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-16 21:45:45

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

用主动进攻确保AI安全,微软披露其“AI红队”细节 | 最前线
...间8月7日,微软在其官网发文,公布了其内部人工智能“红队”的相关细节。该团队于2018年正式成立,由一群跨学科专家组成,目的是揭露人工智能系统存在的漏洞。这一举措意在应对如今
2023-08-08 17:40:00
openai概述gpt-4o模型系统卡准备框架
...概述了GPT-4o模型的系统卡(SystemCard),介绍了包括外部红队(模拟敌人攻击)、准备框架(PreparednessFramework)在内的诸多细节
2024-08-11 03:20:00
海南东方“村BA”丨八所镇福耀社区75:60轻取四更镇上荣村
...更镇上荣村(下称“白队”)与八所镇福耀社区(下称“红队”)。19日第二场,上荣村(四更镇) VS 福耀社区(八所镇)。记者 陈卫东 摄 比赛开始,红队外线切入抛投率先拿分,
2023-11-19 22:17:00
海南东方“村BA” | 精彩连连进球不断 华侨经济区大坡村68:56东河镇广坝居队
...大坡村队(下称“蓝队”)对阵东河镇广坝居队(下称“红队”)。比赛开始,蓝队率先投中两分,随后突破上篮再中;红队则凭借主力后卫的全场一条龙命中并造成加罚。此后蓝队篮下强打命中,
2023-11-24 23:47:00
海南东方“村BA” | 持续焦灼!天安乡安都村73:61战胜新龙镇部道村
...新龙镇部道村(下称“蓝队”)与天安乡安都村(下称“红队”)。比赛开始,双方积极寻找状态,蓝队篮下打进率先开局,红队也内线强打命中;此后蓝队持续冲入内线造成杀伤,红队则通过三分
2023-11-20 00:33:00
海南东方“村BA” | 险些上演15分大逆转!首场比赛三家镇红草村91:88险胜江边乡江边村
...家镇红草村(下称“白队”)对阵江边乡江边村(下称“红队”)。比赛开始,双方你来我往,红队传切配合打下2分,白队九号内线持续发威篮下强打打成;红队反手上篮不中后队友补篮得手;红
2023-11-18 00:49:00
排超全明星赛男子组激战 李咏臻率黄队2-1挫红队
全明星红队队长翟德军发球北京时间1月14日,2023-2024中国排球超级联赛全明星赛男子组比赛在临沂结束。李咏臻担任队长的全明星黄队以2-1力挫翟德军领衔的全明星红队
2024-01-14 17:00:00
排超全明星赛女子组激战3局 李盈莹率黄队2-1险胜
...盈莹领衔的全明星黄队以2-1力挫龚翔宇担任队长的全明星红队,三局比分为25-22、20-25和17-15。此役红队的首发阵容为主攻仲慧、米哈伊洛维奇,副攻高意、武奇科娃,接应
2024-01-14 19:00:00
DNF:巴卡尔懒人开荒攻略!只需要记住1条路线,应对千变万化
...3龙就不会唤醒,因此绿队不需要buff就能打掉增伤怪。“红队”,先打长脚怪,根据长脚怪的buff打对应门将,然后再根据门将buff打对应精英增伤怪
2023-06-28 13:27:00
更多关于科技的资讯:
双城耀国庆 绮梦筑新章——恐龙园集团文旅产品“出圈”更“出彩”
今年国庆、中秋假期恐龙园集团旗下环球恐龙城与东方盐湖城凭借全新业态与沉浸式体验双双跻身长三角文旅“顶流”双节期间,约62
2025-10-09 21:49:00
NBA中国携手阿里云开启多年合作,球迷互动体验新惊喜在哪?
10月9日,NBA中国和阿里云宣布达成多年合作,阿里云将正式成为NBA中国官方云计算与人工智能合作伙伴,基于通义千问大模型和云计算基础设施
2025-10-09 22:19:00
获充换电大会官方推荐及星级认证, 公牛充电桩全场景方案引关注
9月27日至29日,2025中国汽车充换电生态大会在合肥举行,此次大会由国家能源局电力司、安徽省汽车办、中国汽车工业协会共同指导
2025-10-09 17:04:00
“北京榜样•最美互联网从业者”提名人选|我爱我家陈少亮:数字浪潮中的筑梦人
2025年的北京,秋阳穿过写字楼玻璃幕墙,在键盘上投下斑驳光影。在我爱我家集团总部技术中心,陈少亮正盯着屏幕上的数据流图
2025-10-09 17:05:00
中新经纬10月9日电 工信部网站9日消息,工业和信息化部、国家标准化管理委员会近期联合发布《云计算综合标准化体系建设指南(2025版)》(下称《指南》)
2025-10-09 13:06:00
当下,网络热搜榜单已经成为我们感知世界的一个重要窗口。这个窗口展示的内容是否真实、健康、积极,直接影响着数亿网民的认知判断
2025-10-09 10:31:00
高低2025年国庆中秋双节,中国电影市场成绩亮眼:国庆档总票房破17亿元,10月2日年度总票房达425.02亿元,超2024年全年
2025-10-09 10:49:00
厦门网讯(厦门日报记者 李晓平)如今,拍照不再停留在平面,“一站式”3D人像打印,正让影像“立”起来,成为更多人的选择
2025-10-08 08:12:00
小牛FX风速款首销战报:5小时全渠道销量14252台,以“价值重构”引爆全民抢购潮
2025年9月29日,全球高端智能电动车领导品牌小牛电动正式发布FX风速款首销战报。数据显示,这款被业界称为“价格屠夫”的新品在9月28日首发后
2025-10-08 09:00:00
稳就业 稳企业 稳市场 稳预期|从 “设备制造” 到 “全链服务”:陕西电子长岭电气纺织机电产业的进阶之路
9月29日,由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动,带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察
2025-10-08 17:51:00
近日,中国物流与采购联合会公布全国第十批5A级供应链服务企业名单,华远国际陆港集团正式通过评审,获评“5A级供应链服务企业”
2025-10-08 18:01:00
货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期,我市消费市场“热”力值拉满,处处繁荣兴旺、活力十足。10月8日
2025-10-08 18:32:00
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00