• 我的订阅
  • 财经

中国科学院院士何积丰:利用对齐技术为大模型戴上“紧箍咒”

类别:财经 发布时间:2023-09-07 14:46:00 来源:北京商报

北京商报讯(记者 刘四红)模型的通用能力让其能够应用到人类生产生活的各个场景中,可谓“无孔不入”。但AI的发展也因此带来了新的安全隐私问题,如何解决这一隐患,9月7日开幕的2023 INCLUSION·外滩大会上,中国科学院院士何积丰开出了他的“药方”:利用对齐技术为大模型戴上紧箍咒。

何积丰认为,大模型的安全问题主要是在未经同意的情况下,收集、使用和泄露个人信息。隐私问题既可能发生在训练过程,也可能发生在使用过程中,而大模型的生成能力则让“隐私泄露”的方式变得多样化,造成隐私保护更加困难。

“为了应对这些问题,我们需要大模型对齐技术。”何积丰说,“对齐(alignment)”是指系统的目标和人类价值观一致,使其符合设计者的利益和预期,不会产生意外的有害后果。“如果把人工智能看作西游记里的孙悟空,‘对齐’就是唐僧的紧箍咒。有了紧箍咒,就可以保证技术不会任意使用能力胡作非为。”

不过,对齐技术同样面临挑战。首先,对齐的基础,人类的价值观是多元且动态变化的,需要保证大模型为人服务、与人为善;其次,大模型的有用性与无害性之间目标也不完全一致。如何对错误进行有效纠正,设好大模型的“紧箍咒”也是挑战。

因此,对齐技术已经成为了一项令人眼花缭乱的跨学科研究,不仅考验技术,也审视文化。

何积丰介绍,反馈强化学习是实现对齐的技术途径,目前有两种方式,一种方式是通过人工反馈给模型不同的奖励信号,引导模型的高质量输出;另一种方式,事先给大模型提供明确的原则,系统自动训练模型对所有生成的输出结果提供初始排序。“这意味着,不仅智能系统需要向人类价值观对齐,人类的训练方法也要向价值观对齐。”何积丰说。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-07 18:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

(经济观察)中外院士共谈AI大模型:应对大模型安全问题需设好“紧箍咒”
...7日电 (高志苗 王梦瑶)“伏羲”说:9月1日上海不下雨。中国科学院院士、复旦大学副校长张人禾7日在2023外滩大会上表示,20年来复旦大学首次举办户外开学典礼背后有气象大模
2023-09-07 16:46:00
...困难,怎么办?在9月7日开幕的2023 INCLUSION·外滩大会上,中国科学院院士何积丰开出了他的“药方”:利用对齐技术为大模型戴上紧箍咒。何积丰认为,大模型的安全问题主
2023-09-07 16:27:00
...质疑。对于如何解决人工智能大模型时代的新安全隐患,中国科学院院士何积丰开出了“药方”:利用对齐技术为大模型设好紧箍咒。他解释,“对齐”是指系统的目标和人类价值观一致,使其符合
2023-09-09 04:45:00
...水量。热点九:“限包令”落地——食品过度包装有了“紧箍咒”中国食品科学技术学会名誉副理事长、中国农业大学特殊食品研究中心主任罗云波:过度包装会导致环境污染、资源浪费。新修订的
2023-01-09 09:03:00
...品。热点九: “限包令”落地——食品过度包装有了“紧箍咒”解读专家:罗云波 中国食品科学技术学会名誉副理事长、中国农业大学特殊食品研究中心主任法规标准的修订与实施有助于减轻消
2023-01-10 10:11:00
吴立新院士:超算与人工智能深度融合的时代已经来临
...a 2023)在山东青岛举行。新十四届全国人大常委会委员、中国科学院院士吴立新表示,“超算与人工智能深度融合的时代已经来临。它必将是一种新的科学范式,有重大的颠覆性创新。这一
2023-08-25 16:34:00
本文转自:河南日报●伯纳德·麦利森入选中国科学院外籍院士●拉维·席尔瓦、张建伟入选中国工程院外籍院士●今年两院院士增选“河南院士”已达6人本报讯(记者 尹江勇)11月23日,中国
2023-11-24 05:25:00
(中国科学院院士、发展中国家科学院院士、中国医学科学院学部委员、广东省智能科学与技术研究院院长张旭在2024大湾区科学论坛接受凤凰网财经的独家采访)作者|王迪11月18日,对于目
2024-11-18 21:54:00
五位院士喊话年轻人:“怀疑一切”“得折腾”
...至右分别为詹文龙、李惕碚、王贻芳、陈和生、高原宁。中国科学院高能物理研究所供图■本报记者 倪思洁“怀疑一切权威理论。”“你们得折腾。”“放开思想。”近日,在中国科学院高能物理
2023-06-28 06:34:00
更多关于财经的资讯:
时隔2个月管理层再生变 *ST赛隆节后首日股价跌停
10月8日,*ST赛隆(002898)披露公告称,公司董事会于近日收到董事长兼总裁陈科、副总裁兼董事会秘书张旭、副总裁段代风的书面辞职报告
2025-10-09 22:04:00
招商银行唐山分行:践行“透明金融” 为实体经济发展注入“强心剂”
河北新闻网讯(王宇莹 张学鹏)“以前申请贷款,总怕有‘隐性成本’,现在有了这张‘贷款明白纸’,利息、评估费甚至抵押登记费都列得明明白白
2025-10-09 19:16:00
筑牢货币安全网,守好群众“钱袋子”——贵州银行威宁支行、六桥支行走进老年大学开展反假货币宣传
9月16日,贵州银行威宁支行联合六桥支行走进老年大学,开展“反假货币知识进老年大学”专题宣传活动。活动现场,老年学员们纷纷围拢在工作人员身旁
2025-10-09 17:03:00
威宁农信联社盐仓信用社:金融政策进乡村 暖心服务惠万家
为持续推动金融惠民政策落地落实,提升村民金融素养与风险防范能力,近日,在人民银行毕节市分行的指导下,威宁农信联社普惠金融部联合盐仓信用社走进盐仓镇团结村
2025-10-09 17:03:00
警银协作再显成效 拦截5.7万元诈骗资金
2025年9月17日,毕节农商银行反诈预警系统提示客户钟某账户交易异常,朱昌支行工作人员排查发现,该账户14时26分由陌生交易对手陈某转入6万元可疑资金
2025-10-09 17:03:00
网上“美女”推销“珍藏酒”,银行员工及时拦截助老人止损
“杨大爷,您这突然转钱买酒,对方您认识吗?这事儿可得跟家里人商量下!”近日,在贵州银行雷山支行网点,大堂经理小余的耐心劝阻
2025-10-09 17:03:00
第五届邮储银行理财节“财富伴您行”财富论坛唐山场落幕
近日,第五届邮储银行理财节“财富伴您行”系列财富论坛唐山场举办。活动紧扣“风险隔离与财富传承”的高净值客户核心需求,邀约近50位富嘉
2025-10-09 15:16:00
林宏楠获批担任兴业消费董事
10月9日,福建金融监管局发布关于林宏楠兴业消金董事任职资格的批复,核准林宏楠兴业消费金融股份公司董事的任职资格。
2025-10-09 12:50:00
中国钢研成立智行科技公司,含AI业务
近日,钢研智行(北京)科技有限公司成立,注册资本3000万元,经营范围包含:物联网设备制造;物联网技术服务;人工智能基础资源与技术平台
2025-10-09 10:12:00
智谱AI、凯文教育等成立新公司,含AI及机器人业务
近日,北京智启文华教育科技有限公司成立,注册资本5000万元,经营范围包含:人工智能理论与算法软件开发;人工智能公共服务平台技术咨询服务
2025-10-09 10:12:00
金融教育宣传周 用金融温度守护最美“夕阳红
责任编辑:张子川
2025-10-09 10:30:00
金融教育宣传周 筑牢“数字名片”安全防线
责任编辑:张子川
2025-10-09 10:32:00
鸡排哥8天假期涨粉超40万,节前已成立工作室
10月8日,景德镇鸡排哥发视频向全国各地来到家乡景德镇游玩和打卡买鸡排的游客表示感谢。鸡排哥表示近期天气炎热,游客为买鸡排有时需排队几个小时
2025-10-09 10:36:00
中国证监会、财政部就《证券期货违法行为吹哨人奖励工作规定(征求意见稿)》公开征求
为深入贯彻党中央、国务院决策部署,进一步完善举报制度,有效回应市场关切,弘扬公正担当的吹哨人文化,更好适应资本市场高质量发展和监管执法工作要求
2025-10-09 10:40:00
嵊州农商行因员工与贷款管理双失责被罚105万元,两责任人遭警告
10月9日,国家金融监督管理总局绍兴监管分局行政处罚信息公开表显示,浙江嵊州农村商业银行股份有限公司及相关责任人因员工行为管理不到位;项目贷款管理不审慎等被罚款105万元;王某波
2025-10-09 10:56:00