• 我的订阅
  • 科技

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

类别:科技 发布时间:2024-05-24 16:30:00 来源:AI新智界

文章来源:机器之心

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

人工智能(AI)的安全问题,正以前所未有的关注度在全球范围内被讨论。

日前,OpenAI 联合创始人、首席科学家 Ilya Sutskever 与 OpenAI 超级对齐团队共同领导人 Jan Leike 相继离开 OpenAI,Leike 甚至在 X 发布了一系列帖子,称 OpenAI 及其领导层忽视安全而偏爱光鲜亮丽的产品。这在业界引起了广泛关注,在一定程度上凸显了当前 AI 安全问题的严峻性。

5 月 21 日,图灵奖得主 Yoshua Bengio、Geoffrey Hinton 和姚期智联合国内外数十位业内专家和学者,在权威科学期刊 Science 上刊文,呼吁世界各国领导人针对 AI 风险采取更有力的行动,并警告说,“近六个月所取得的进展还不够”。

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

他们认为,AI 的无节制发展很有可能最终导致生命和生物圈的大规模损失,以及人类的边缘化或灭绝。

在他们看来,AI 模型的安全问题,已经上升到足够威胁人类未来生存的水平。

同样,AI 模型的安全问题,也已经是可以影响每一个人、每一个人都有必要关心的话题。

5 月 22 日,注定是人工智能史上的一个重大时刻:OpenAI、谷歌、微软和智谱AI 等来自不同国家和地区的公司共同签署了前沿人工智能安全承诺(Frontier AI Safety Commitments);欧盟理事会正式批准了《人工智能法案》(AI Act),全球首部 AI 全面监管法规即将生效。

再一次,AI 的安全问题在政策层面被提及。

人工智能首尔峰会“宣言”

在以“安全、创新、包容”为议题的“人工智能首尔峰会”(AI Seoul Summit)上,来自北美、亚洲、欧洲和中东地区的 16 家公司就 AI 开发的安全承诺达成一致,共同签署了前沿人工智能安全承诺,包括以下要点:

确保前沿 AI 安全的负责任治理结构和透明度; 基于人工智能安全框架,负责任地说明将如何衡量前沿 AI 模型的风险; 建立前沿 AI 安全模型风险缓解机制的明确流程。

图灵奖得主 Yoshua Bengio 认为,前沿人工智能安全承诺的签署“标志着在建立国际治理制度以促进人工智能安全方面迈出了重要一步”。

作为来自中国的大模型公司,智谱 AI 也签署了这一新的前沿人工智能安全承诺。

对此,OpenAI 全球事务副总裁 Anna Makanju 表示,“前沿人工智能安全承诺是促进更广泛地实施先进 AI 系统安全实践的重要一步。” Google DeepMind 总法律顾问兼治理主管 Tom Lue 说道,“这些承诺将有助于在领先开发者之间建立重要的前沿 AI 安全最佳实践。”智谱AI 首席执行官张鹏表示,“伴随着先进技术而来的是确保 AI 安全的重要责任。”

日前,智谱AI 也受邀亮相AI 顶会 ICLR 2024,并在题为“The ChatGLM's Road to AGI”的主旨演讲中分享了他们针对 AI 安全的具体做法。

他们认为,超级对齐(Superalignment)技术将协助提升大模型的安全性,并已经启动了类似 OpenAI 的 Superalignment 计划,希望让机器学会自己学习、自己判断,从而实现学习安全的内容。

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

他们透露,GLM-4V 即内置了这些安全措施,以防止产生有害或不道德的行为,同时保护用户隐私和数据安全;而 GLM-4 的后续升级版本即 GLM-4.5 及其升级模型,也应当基于超级智能(Superintelligence)和超级对齐技术。

我们也发现,在一篇近期发表的论文中,智谱AI、清华团队介绍了一种通过利用大量自生成的否定词而实现的无反馈(feedback-free)大型语言模型对齐方法——Self-Contrast。

据论文描述,在只有监督微调(SFT)目标的情况下,Self-Contrast 就可以利用 LLM 本身生成大量不同的候选词,并利用预先训练的嵌入模型根据文本相似性过滤多个否定词。

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

论文链接:https://arxiv.org/abs/2404.00604

在三个数据集上进行的直接偏好优化(DPO)实验表明,Self-Contrast 可以持续大幅超越 SFT 和标准 DPO 训练。而且,随着自生成的负样本数量增加,Self-Contrast 的表现也在不断提高。

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

总的来说,这一研究为偏好数据缺失情况下的对齐(如 RLHF 方法)提供了一种新的方法。在偏好数据标注代价昂贵且难以获得的情况下,可以利用未标注的 SFT 数据构建语法偏好数据,通过增加负样本的数量来弥补因正样本不足造成的性能损失。

欧盟理事会正式批准《人工智能法案》

同日,欧盟理事会也于同日正式批准了《人工智能法案》(AI Act),这是全球首部 AI 全面监管法规,这一具有里程碑意义的人工智能法规将于下月生效,目前仅适用于欧盟法律范围内的领域,或将为商业和日常生活中使用的技术设定一个潜在的全球基准。

“这部具有里程碑意义的法规是世界上第一部此类法规,它解决了一个全球性的技术挑战,同时也为我们的社会和经济创造了机遇,” 比利时数字化大臣 Mathieu Michel 在一份声明中说。

这一综合性的 AI 立法采用“基于风险”的方法,意味着对社会造成伤害的风险越高,规则就越严格。例如,不构成系统性风险的通用目的 AI 模型将承担一些有限的要求,但那些具有系统性风险的则需要遵守更严格的规定。

对违反《人工智能法案》中行为的罚款,该法案设定为违规公司前一个财年全球年营业额的百分比或预定的金额,以较高者为准。

如今,无论是小到科技公司,还是大到政府机构,都已经将预防、解决 AI 安全问题提上日程。正如牛津大学工程科学系教授 Philip Torr 所言:

“在上一次人工智能峰会上,全世界一致认为我们需要采取行动,但现在是时候从模糊的建议转变为具体的承诺了。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-24 21:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

亚马逊谷歌IBM微软等巨头刚刚承诺一同对抗人工智能选举干扰
...、IBM、Meta、微软、OpenAI、TikTok、X等20 家参与构建或使用人工智能技术的科技公司共同承诺:努力检测和打击选举中的有害人工智能内容
2024-02-19 12:00:00
微软Ignite全球技术大会:引领AI时代的创新与变革
...、企业领袖和行业专家的盛会,微软Ignite旨在探讨和推动人工智能(AI)在工作环境中的应用与发展。 #玩转AI摘要#本次大会将围绕三大议题展开讨论,包括如何将AI功能全面渗
2023-10-28 13:32:00
...洛文尼亚签署了一项协议,承诺遵守联合国教科文组织的人工智能伦理建议。教科文组织总干事阿祖莱表示,教科文组织2021年11月通过了《人工智能伦理问题建议书》,“今天,我们又迈出
2024-02-07 00:42:00
...表致辞并向与会嘉宾致以诚挚欢迎和衷心感谢。他认为,人工智能潮流席卷而来,中国制造的未来格局需要巧妙地平衡“四对关系”,只有同时重视技术、组织和人才的协同发展,方能行稳致远。法
2024-04-17 14:28:00
人工智能论文全球百强企业榜单出炉:中国21家入围
...全与新兴技术中心”(CSET)近日发布全球私营企业各项人工智能成就汇总结果。CSET选取截至去年底近10年来发表的高被引用人工智能论文,汇总各公司表现。其中,中国有21家企业
2024-08-14 17:56:00
谁在反对ChatGPT?
ChatGPT的爆火,点燃了一场以硅谷为圆心,辐射至全球的人工智能竞赛。当科技公司对人工智能概念疯狂上头,其在缺乏风险监管下的“过速”发展同样引起了警惕。3月底,千余名科技界领袖
2023-04-24 15:27:00
微软推出“智能副驾”(Copilot),您的人工智能日常助手
我们正在步入一个全新的人工智能时代,当下,我们与科技之间的关系以及我们从科技中受益的方式正在从根本上发生改变。伴随着人机聊天互动与大语言模型的相互融合,如今这项技术已经聪明到可以
2023-09-22 20:49:00
世界人工智能大会开幕:马斯克、华为胡厚崑共话AIGC,谷歌、特斯拉展示AI能力
...热潮,以及美国对中国 AI 实施权利竞争等因素下,世界人工智能行业走向何方?7月6日,2023世界人工智能大会(WAIC)在上海世博中心正式拉开帷幕
2023-07-06 22:00:00
今年以来,以开放人工智能研究中心(Open AI)推出现象级生成式人工智能产品ChatGPT为标志,美国主要科技公司纷纷跟进。随着此轮人工智能井喷式发展,风口机遇与风险挑战“共舞
2023-08-25 07:12:00
更多关于科技的资讯:
2025年,“商业航天”无疑是中国经济领域最热的关键词之一。这股热潮的兴起并非偶然,而是多重因素共同催化的结果——“商业航天”被写入国家“十五五”规划
2026-01-15 11:33:00
大河网讯(记者 赵檬 王怡潇 )蜜雪冰城开到美国好莱坞,锅圈食汇解决家庭聚餐新需求……河南食品企业越来越“潮”,频频打造全国爆款
2026-01-15 12:03:00
1月13日,“又一省份取消12345热线语音导航”的话题登上社交平台热搜。辽宁省营商环境建设领导小组办公室印发了《2026年优化政务环境行动方案》
2026-01-15 13:25:00
千问App全面接入支付宝,上线AI付款
1月15日,千问App宣布全面接入淘宝闪购和支付宝AI付,实现一句话点外卖。用户只需在千问的聊天框里自然说话,如“帮我点杯奶茶”或“帮我点两杯咖啡”
2026-01-15 13:33:00
千问App接入淘宝、闪购,测试AI购物功能
1月15日,千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能
2026-01-15 11:00:00
阿里千问领先谷歌推出AI购物功能
1月15日,千问App宣布全面接入淘宝、支付宝、闪购、飞猪、高德等阿里生态业务,率先实现点外卖、买东西、订机票等AI购物功能
2026-01-15 11:01:00
首批500辆助力版小红车已上线每日商报讯 “杭州小红车好像有助力版本了!”近日,一批助力版小红车悄然现身杭州街头,凭借酷炫外观和智能助力功能
2026-01-15 08:20:00
中国科大发明晶体“自刻蚀”新工艺 实现低维光伏材料精密制备
大皖新闻讯 1月15日凌晨,大皖新闻记者从中国科学技术大学获悉,该校张树辰特任教授团队联合中外学者,在新型半导体材料领域取得重要进展
2026-01-15 08:56:00
技术赋能场景 数据驱动创新 山东移动日照分公司亮相全国产业大会彰显数智硬实力
鲁网1月14日讯 (记者 王一凡)1月14日,2026高质量数据集与数据标注产业供需对接活动在日照市举办。中国移动作为数据要素领域领军企业
2026-01-15 09:06:00
厦门网讯(厦门日报记者 应洁)9大主题板块、30多个巨型灯组、5万多平方米沉浸式灯海——厦门文旅集团近日发布消息称,厦门园博苑灯会将扩容升级
2026-01-15 09:10:00
李英锋随着AI生成技术在电商领域的快速渗透,不少商家开始使用AI生成的图片、视频作为商品宣传素材,凭借精美视觉效果吸引消费者下单
2026-01-15 10:30:00
索乙1月14日发布的2025年进出口数据显示,我国专用装备、高端机床及工业机器人出口表现亮眼,同比分别增长20.6%、21
2026-01-15 10:30:00
杭州日报讯 一名眼科医生可以为行业带来多少改变?杭州明视康眼科医院院长张君告诉你,从打破技术垄断开始。多年来,从跨国企业屈光技术专家转型为国内顶尖的眼科临床医生
2026-01-15 06:48:00
王智超摘要:数字化转型已成为企业应对市场竞争、实现高质量发展的核心驱动力。在数字技术与实体经济深度融合的背景下,传统企业管理模式面临信息传递滞后
2026-01-15 07:02:00
全球前25位!来自浙江的他成为中国唯一登榜学者
近日,国际权威学术平台F1000旗下期刊《F1000Research》发布了一份重量级文献计量分析报告《Top Performers in a Decade of Otolary
2026-01-15 07:49:00