• 我的订阅
  • 科技

隐私保护更困难了?院士建议:用这种技术为大模型戴上紧箍咒

类别:科技 发布时间:2023-09-07 16:27:00 来源:中新经纬

中新经纬9月7日电 (常涛)大模型的生成能力让“隐私泄露”的方式变得多样化,造成隐私保护更加困难,怎么办?

在9月7日开幕的2023 INCLUSION·外滩大会上,中国科学院院士何积丰开出了他的“药方”:利用对齐技术为大模型戴上紧箍咒。

何积丰认为,大模型的安全问题主要是在未经同意的情况下,收集、使用和泄露个人信息。隐私问题既可能发生在训练过程,也可能发生在使用过程中。而模型的通用能力,又让其能够应用到人类生产生活的各个场景中,可谓“无孔不入”,这就带来了很大的安全隐患。

“为了应对这些问题,我们需要大模型对齐技术。”何积丰说,“对齐(alignment)”是指系统的目标和人类价值观一致,使其符合设计者的利益和预期,不会产生意外的有害后果。“如果把人工智能看作西游记里的孙悟空,‘对齐’就是唐僧的紧箍咒。有了紧箍咒,就可以保证技术不会任意使用能力胡作非为。”

不过,对齐技术同样面临挑战。首先,对齐的基础,需要保证大模型为人服务、与人为善;其次,大模型的有用性与无害性之间目标也不完全一致。如何对错误进行有效纠正,设好大模型的“紧箍咒”也是挑战。

因此,对齐技术已经成为了一项令人眼花缭乱的跨学科研究,不仅考验技术,也审视文化。何积丰介绍,反馈强化学习是实现对齐的技术途径,目前有两种方式,一种方式是通过人工反馈给模型不同的奖励信号,引导模型的高质量输出;另一种方式,事先给大模型提供明确的原则,系统自动训练模型对所有生成的输出结果提供初始排序。“这意味着,不仅智能系统需要向人类价值观对齐,人类的训练方法也要向价值观对齐。”何积丰说。

(更多报道线索,请联系本文作者常涛:changtao@chinanews.com.cn)(中新经纬APP)

中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其它方式使用。

责任编辑:罗琨 李中元

来源:中新经纬

编辑:郑铮

广告等商务合作,请点击这里

未经过正式授权严禁转载本文,侵权必究

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-07 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国科学院院士何积丰:利用对齐技术为大模型戴上“紧箍咒”
...型的生成能力则让“隐私泄露”的方式变得多样化,造成隐私保护更加困难。“为了应对这些问题,我们需要大模型对齐技术。”何积丰说,“对齐(alignment)”是指系统的目标和人类
2023-09-07 14:46:00
(经济观察)中外院士共谈AI大模型:应对大模型安全问题需设好“紧箍咒”
...型的生成能力则让“隐私泄露”的方式变得多样化,造成隐私保护更加困难。“为了应对这些问题,我们需要大模型对齐技术。”何积丰说,“对齐”是指系统的目标和人类价值观一致,使其符合设
2023-09-07 16:46:00
...本问题,比期待算力成本下降更加有效。”李迪说。安全隐私保护仍存隐患把自己的论文上传到网站上,希望AI系统帮忙润色或“查重”,却发现自己的原创文章很快被互联网资源库收录;将工作
2023-09-09 04:45:00
...提醒,大模型的生成能力让隐私泄露方式变得多样化,使隐私保护更加困难,“如果把AI看作孙悟空,‘对齐技术’就是唐僧口中的‘紧箍咒’。对齐考验技术,也审视文化。这意味着,不仅AI
2023-09-11 06:06:00
人工智能研究院何积丰:大模型时代的隐私安全问题涉及到三个纬度
...最后,生成能力让“隐私泄露”的方式变得多样化,也让隐私保护更加困难。“在提供大模型训练数据的过程中,虽然可以通过脱敏处理使数据更加抽象和类型化,但因为大模型可以进行跨领域的交
2024-02-03 16:19:00
财经观察:护航数字经济 共话数据安全治理
...面数据泄露、数据滥用等数据安全问题,从法律、服务、隐私保护计算的最新发展等方面,探讨了数据安全治理和发展模式的趋势。国家互联网信息办公室总工程师孙蔚敏发言。主办方供图围绕当下
2023-05-28 08:53:00
AI要骗过全人类了!GPT-4伪装成人类骗过了54%的人
...们在关注如何利用科技造福人类的同时,也得给AI戴上“紧箍咒”,制定一套完善的法律法规和伦理规范。这就像是给AI技术划定了一条明确的界限,让它只能在规定的范围内活动。这样一来,
2024-06-26 09:38:00
沈昌祥院士:开创智能算力安全可信新生态
本文转自:人民网中国工程院院士沈昌祥发言。人民网记者 王天乐摄人民网宜昌8月22日电 (记者王绍绍)近日,“三峡(湖北宜昌)算力供应链启动暨产业招商发布会”在宜昌市点军区举办。在
2024-08-22 15:55:00
...模型的这些App上。——智能产业研究院院长、中国工程院院士 张亚勤大模型并不能一劳永逸,具体场景功能的实现需要依靠垂直领域的发展。企业没有必要挤在大模型的赛道里,和大厂直接竞
2023-07-08 05:04:00
更多关于科技的资讯:
全民可感可玩可参与!2025北京机器人文化节落幕,昌平区打造沉浸式体验推动机器人产业场景融合
10月2日,由iCANX全球科学平台主办的“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇顺利落下帷幕
2025-10-10 14:59:00
合作再升级 阿维塔完成向华为115亿投资支付
阿维塔给华为打了34.5亿,这是第三笔投资款,算下来阿维塔前后一共给了115亿,现在这笔钱全付清了,这意味着阿维塔正式拿到了华为引望10%的股份
2025-10-10 12:16:00
记者10月9日获悉,国家发展改革委、市场监管总局近日发布《关于治理价格无序竞争维护良好市场价格秩序的公告》,提出在保护经营者自主定价权的前提下
2025-10-10 12:20:00
中新经纬10月10日电 题:京东为啥也要卖咖啡?作者 朱丹蓬 广东省食品安全保障促进会副会长、中国食品产业分析师随着消费者对“即买即得”需求的日益增长
2025-10-10 12:23:00
虎鲸文娱发布《2025国庆假期文娱消费报告》票房火热 大屏“圈粉”南报网讯(记者鲁舒婷)10月8日,虎鲸文娱发布的《2025国庆假期文娱消费报告》(以下简称《报告》)显示
2025-10-10 07:32:00
名创优品MINISO深耕IP战略:岭南骑楼店开业首日引爆Z世代消费热潮
2025年8月17日,名创优品MINISO LAND华南首店于广州北京路步行街正式开业。该店以百年岭南骑楼为空间载体,融合超过100个全球热门IP
2025-10-09 11:15:00
荣耀Magic8系列发布会官宣定档10月15日
10月9日,荣耀官方正式宣布,主题为“开新局・见未来”的荣耀 Magic8 系列暨 Magic OS10 发布会将于10 月15日正式举行
2025-10-09 11:30:00
局部降水量80毫米以上!10—14日烟台市将有持续连阴雨天气
齐鲁晚报·齐鲁壹点 周宣刚10月7日10时,烟台市气象局发布10—14日连阴雨天气预报和大风警报。受高空槽东移和暖湿气流输送北上的水汽影响
2025-10-09 11:31:00
权威发布, 福瑞达颐莲品牌价值评估突破120亿
2025年9月25日,在中国香料香精化妆品工业协会主办的“2025中国香妆品牌价值大会”上,福瑞达生物股份旗下颐莲品牌凭借卓越的市场表现与品牌影响力
2025-10-09 11:32:00
持续创新高!高德扫街榜上线23天用户超4亿
这个国庆黄金周,高德APP和高德扫街榜正在持续创新高——10月3日,高德扫街榜宣布:上线仅23天,累计用户超4亿。10月1日
2025-10-09 11:33:00
国庆中秋,大马再掀中餐热潮!“鱼你速度”树出海标杆!
国庆中秋双节期间,马来西亚再度掀起中餐热潮!以“鱼你在一起”为代表的中餐连锁品牌,在当地各大商圈持续引爆消费热情。“6个月
2025-10-09 11:34:00
开启商超智慧储鲜,澳柯玛新品冷柜让食材更鲜活
鲁网10月9日讯当社区团购爆单时冰柜塞不下?当生鲜进货量太大冻不透?当网红雪糕因串味被迫贱卖?针对这些让商超、饭馆等用户抓狂的痛点
2025-10-09 11:40:00
鸡排哥8天假期涨粉超40万,节前已成立工作室,10月9日休息一天
10月8日,江西景德镇鸡排哥在个人社交账号发布一则视频,向全国各地来到家乡景德镇游玩和打卡买鸡排的游客表示感谢。鸡排哥表示近期天气炎热
2025-10-09 12:09:00
大疆部分产品直降千元!消费者炸锅,官方回应
10月8日,大疆在官网提前挂出“双十一”促销信息,多款产品价格直降数百至上千元。此次降价幅度较大。从几百元到几千元不等
2025-10-09 13:45:00
单日游客最高突破6.9万人次 忠县橘若·忠州渡接住“泼天流量”
这个国庆假期,重庆忠县江畔的橘若·忠州渡结结实实地“火”出了圈,八天揽客30余万人次,游客单日最高接待量突破6.9万人次
2025-10-09 13:57:00