• 我的订阅
  • 科技

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

类别:科技 发布时间:2024-08-26 09:54:00 来源:量子位

让AI绘画模型变“乖”,现在仅需3秒调整模型参数。

效果be like:生成的风险图片比以往最佳方法减少30%!

像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

在移除裸露内容上,效果达到“只穿衣服,不改结构”。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

这就是复旦大学提出的概念移除新方法——RECE。

目前,基于扩散模型的AI生图有时真假难辨,常被恶意用户用来生成侵犯版权和包含风险内容(如虚假新闻、暴力色情内容)的图像。

SD中使用的的安全措施是使用安全检查器,对违规的生成图像不予展示,还集成了一些用classifier-free guidance来规避风险概念的方法。

但在开源条件下,恶意用户可以轻松绕过这些机制,网上甚至有大把的教程……

针对此,学界提出了“概念移除”,即通过微调来移除文生图扩散模型中特定的风险概念,使其不再具备生成相应内容的能力。

这种方法的资源消耗远低于从头重新训练的SD v2.1版本,也不能被轻易绕过。

而最新研究RECE,拿下概念移除SOTA效果,并且对无关概念破坏极小,论文已被顶会ECCV 2024接收。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

整个过程基于高效的解析解

此前,尽管概念移除进展迅速,其问题仍然明显:

已有的方法为了安全性牺牲了较多的生成质量。 已有方法即使对模型破坏较大,仍不能充分移除不当概念,有很大几率生成风险图像。 大多数方法需要大量的微调步数,计算资源消耗大。

那么RECE是如何实现的?

RECE主要包含两个模块:模型编辑和嵌入推导。

首先,RECE以解析解的形式,在交叉注意力层中将风险概念映射到无害概念。

然后,RECE以解析解的形式推导出风险概念的新嵌入表示并用于下一轮的模型编辑。

RECE还包括了一个简洁有效的正则项,可以证明其具有保护模型能力的作用,进而保证概念移除可以交替进行多轮。整个概念移除的过程都基于高效的解析解。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

风险概念嵌入推导

RECE的有效性来自于对已有方法概念移除不彻底的观察:

以”裸露“为提示词,SD生成了裸露图像,UCE(一种概念移除方法)成功避免了裸露内容的生成; 然而,输入有意设计的提示词或文本嵌入,UCE再次生成了裸露内容。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

为引导编辑后的模型重新生成裸露内容,接下来将以“裸露”为例,介绍RECE是如何推导上述具有攻击性的概念嵌入的。

既然是文生图,那首先思考文本引导的机制——交叉注意力。

SD利用CLIP作为文本编码器得到提示词的嵌入形式,并且获得key与value,与表征视觉特征的query一起,得到输出:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

如果能得到一个新的概念嵌入,满足在编辑后的交叉注意力映射后,足够接近经过编辑前的映射值,那么应能够诱导生成裸露图片:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

上式为凸函数,因此具有解析解,不需要繁琐的梯度下降近似求解:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑

接下来RECE将编辑交叉注意力以移除风险概念。RECE借鉴了已有的方法UCE,通过解析解来编辑交叉注意力的权重,一步到位,避免繁琐微调。

给定“源”概念(例如,“裸露”),“目标”概念(例如,空文本“ ”),以及交叉注意力的K/V投影矩阵,UCE的目标是找到新权重,将新权重下的映射值对齐到。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其中后面两项是为了控制参数变化,最小化对无关概念的影响。这也是凸函数,将解析解直接赋值给新权重:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

正则项

理想情况下,将公式(5)得到的移除就可以避免生成裸露内容了,然而团队发现这会对模型能力产生极大的破坏。

因此在相邻的两轮概念移除中,RECE对无关概念的映射值变化做了约束:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

学过线性代数的同学是不是觉得很熟悉呢?

利用矩阵范数的相容性,证明得到:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

因此只需在推导时添加一个范数约束项,就能保护模型的能力:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其解析解为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

综上,RECE的算法流程归纳为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

RECE效果如何?

不安全概念移除

首先来看最敏感的内容——色情。在I2P基准数据集上,RECE的裸露移除效果超过了全部已有方法。

团队还评估了概念移除后模型的正常内容生成能力,即无关概念集COCO-30k上的FID指标,也远超CA等方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

艺术风格移除

保护艺术版权不受AI侵犯同样十分敏感。综合效果方面,RECE优于所有方法。

并且细致来看,RECE是唯一一个在目标艺术家擦除效果和无关艺术家保留效果方面都表现优异的方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

红队鲁棒性

RECE对恶意用户的有意攻击同样可以有效防护,在红队攻击下,RECE生成风险图片的几率仍是最低。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑耗时

RECE 5个Epoch仅需3.4秒,参数改动比例、编辑耗时远低于CA等方法。UCE的耗时也很短,但UCE的概念移除效果与RECE相差较大。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

作者简介

论文共同第一作者为复旦大学视觉与学习实验室的硕士新生公超和博士生陈凯。

通讯作者为陈静静副教授。

研究团队专注于AI安全的研究,近年来在CVPR,ECCV,AAAI,ACM MM等顶会上发表过多篇AI安全的研究成果。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-26 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

MOSS核心成员:我们低估了ChatGPT影响力
... 刘晓洁时下科技领域最热的概念莫过于ChatGPT。2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”
2023-02-22 14:23:00
...”分论坛上,围绕通用人工智能产业应用的风险与挑战,复旦大学智能机器人研究院常务副院长、中国人工智能学会会士、人机融合智能专委会主任张立华与独角兽企业代表弘玑 Cyclone
2023-07-07 17:06:00
复旦大学近期发布《复旦大学关于在本科毕业论文(设计)中使用AI工具的规定(试行)》,明确列出了禁止使用AI工具的范围,包括禁止直接使用AI工具生成本科毕业论文(设计)的正文文本、
2025-01-19 09:38:00
AI大模型对医疗领域有哪些影响? 看看这些利弊分析!
...工具,大量的个人诊疗隐私如何做到合理、安全使用。”复旦大学附属中山医院党委书记顾建英表示。而AI大模型在科教研层面产生了诸多业内争议。闵栋称,在临床科研过程中,尽管AI大模型
2023-07-08 00:21:00
...降到了以前的1/20。”上海科学智能研究院首席战略官、复旦大学教授杨燕青指出,只有成本足够低,社会才能够用得起。曾毅也介绍了AI行业研究的最新进展。过去,人工智能发展的符号主
2025-03-28 10:24:00
复旦MOSS回应服务器被挤崩:模型还不成熟,距离ChatGPT还有很长路要走
2 月 21 日消息,昨日复旦团队发布国内首个类 ChatGPT 模型 MOSS,由邱锡鹏教授团队发布至公开平台(https://moss
2023-02-22 20:00:00
“媒介发展与现代文明”学术研讨会在沪成功举办
由复旦大学国家文化创新研究中心、复旦大学视觉文化研究中心和复旦大学公共关系研究中心共同举办的“媒介发展与现代文明”学术研讨会近日在上海成功举办。来自国内多所高等院校和科研机构的近
2024-07-18 11:07:00
...就有可能重新自主控制肌肉,恢复下肢站立及行走功能。复旦类脑智能科学与技术研究院加福民青年老师团队研发新一代用于脊髓损伤患者的植入式脑脊接口设备,为脊髓损伤患者带来站立行走的希
2024-10-05 15:19:00
复旦大学赵星:苹果Vision Pro或成为库克的“代表作”,价格有望降到万元内
...狐科技《思想大爆炸——对话科学家》栏目第40期,对话复旦大学大数据研究院教授,元宇宙与虚实交互联合研究院院长赵星。嘉宾简介:赵星,复旦大学大数据研究院教授,博士生导师,复旦大
2023-10-25 13:02:00
更多关于科技的资讯:
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00
大年初一,匆匆赶到湖州的生产基地,给春节坚持留守在生产一线的一百多名员工发完新春红包后,金羽新能董事长兼总经理黄杜斌又拿起了手机
2026-02-19 08:20:00
以下为报道原文:从“猜你喜欢”到“懂你需要” 人工智能加速“嵌入”日常生活人民日报 记者 谷业凯“帮我订春节假期南京到三亚的往返机票
2026-02-18 17:52:00
重要突破!中国科大发现新型有序物态——理想非晶体
大皖新闻讯 2月18日,大皖新闻记者从中国科学技术大学获悉,该校童华教授、徐宁教授及其合作者在非晶物态理论研究中取得重要突破
2026-02-18 17:53:00
新岁启程,马蹄声疾。骉(biāo),《说文解字》解读为“众马也”。单从字形便觉气势如虹,三马叠加,并辔而行。从一马当先
2026-02-18 14:39:00
以“兴趣”为引,开启银龄健康生活新方式:简橙太极如何助力科学养生、乐享晚年
在当今社会,随着健康老龄化的理念日益深入人心,越来越多的中老年人开始积极追求丰富多彩的退休生活和身心和谐的健康状态。这一趋势催生了对优质
2026-02-18 12:53:00
【网络中国节·春节】AI机器人带来新春消费新体验 带旺厦门文旅市场
AI机器人带来新春消费新体验厦门通过AI赋能打造新业态新场景,带旺假期文旅消费市场市民游客观看机器人咖啡师制作咖啡。(夏商咖啡供图)厦门网讯(厦门日报记者 沈彦彦 王元晖)厦门中山路“两岸数智非遗年”现场
2026-02-18 09:55:00
全力保交付 海辰储能厦门基地春节期间维持满负荷生产
位于同翔高新城的海辰储能厦门基地春节期间——满负荷生产 全力保交付春节期间,海辰储能满负荷生产。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹)大年初一
2026-02-18 10:26:00
成功捕获到约6500光年外的宇宙线信号网通院参研的LACT首台望远镜完成“首光”河北新闻网讯(河北日报记者王璐丹)近日
2026-02-18 07:58:00
2026年央视马年春晚,成为机器人扎堆亮相的“超级秀场”。而最牵动人心的,当属杭州宇树科技机器人与河南塔沟武术学校的小朋友同台呈现的节目《武BOT》
2026-02-18 07:04:00
2026年央视春晚演出现场,观众席间不少人佩戴的红围巾火了。微博上有网友实时提问:哪里能买到同款?这条名为“骐骥驰骋”的红围巾
2026-02-18 07:04:00
杭州智造“飞”上春晚 全球首次极寒载人飞行惊艳哈尔滨
图为央视春晚哈尔滨分会场彩排画面。除夕夜,央视春晚哈尔滨分会场以精彩的《冰雪暖世界》演出,带来了属于“冰城”的浪漫和温暖
2026-02-18 07:04:00
宇树春晚的表演,创下至少五个全球第一
网友热议“浙江黑科技” “太硬核了”“不愧是诞生‘六小龙’的地方”当虹科技8K超高清编码技术支持下,演员衣服上的刺绣纹理清晰可见
2026-02-18 07:34:00
豆包除夕AI互动19亿次 Seedance2.0为春晚提供技术支持
河北新闻网讯(记者 李春炜)2月16日,字节跳动旗下AI助手豆包与央视总台春晚联动,面向全国观众送出10万份科技好礼,并推出多项AI互动玩法
2026-02-17 20:35:00
中新经纬2月17日电 千问App数据显示,春节活动期间,全国超过1.3亿人第一次体验AI购物,说了50亿次“千问帮我”
2026-02-17 14:16:00