• 我的订阅
  • 科技

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

类别:科技 发布时间:2024-08-26 09:54:00 来源:量子位

让AI绘画模型变“乖”,现在仅需3秒调整模型参数。

效果be like:生成的风险图片比以往最佳方法减少30%!

像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

在移除裸露内容上,效果达到“只穿衣服,不改结构”。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

这就是复旦大学提出的概念移除新方法——RECE。

目前,基于扩散模型的AI生图有时真假难辨,常被恶意用户用来生成侵犯版权和包含风险内容(如虚假新闻、暴力色情内容)的图像。

SD中使用的的安全措施是使用安全检查器,对违规的生成图像不予展示,还集成了一些用classifier-free guidance来规避风险概念的方法。

但在开源条件下,恶意用户可以轻松绕过这些机制,网上甚至有大把的教程……

针对此,学界提出了“概念移除”,即通过微调来移除文生图扩散模型中特定的风险概念,使其不再具备生成相应内容的能力。

这种方法的资源消耗远低于从头重新训练的SD v2.1版本,也不能被轻易绕过。

而最新研究RECE,拿下概念移除SOTA效果,并且对无关概念破坏极小,论文已被顶会ECCV 2024接收。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

整个过程基于高效的解析解

此前,尽管概念移除进展迅速,其问题仍然明显:

已有的方法为了安全性牺牲了较多的生成质量。 已有方法即使对模型破坏较大,仍不能充分移除不当概念,有很大几率生成风险图像。 大多数方法需要大量的微调步数,计算资源消耗大。

那么RECE是如何实现的?

RECE主要包含两个模块:模型编辑和嵌入推导。

首先,RECE以解析解的形式,在交叉注意力层中将风险概念映射到无害概念。

然后,RECE以解析解的形式推导出风险概念的新嵌入表示并用于下一轮的模型编辑。

RECE还包括了一个简洁有效的正则项,可以证明其具有保护模型能力的作用,进而保证概念移除可以交替进行多轮。整个概念移除的过程都基于高效的解析解。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

风险概念嵌入推导

RECE的有效性来自于对已有方法概念移除不彻底的观察:

以”裸露“为提示词,SD生成了裸露图像,UCE(一种概念移除方法)成功避免了裸露内容的生成; 然而,输入有意设计的提示词或文本嵌入,UCE再次生成了裸露内容。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

为引导编辑后的模型重新生成裸露内容,接下来将以“裸露”为例,介绍RECE是如何推导上述具有攻击性的概念嵌入的。

既然是文生图,那首先思考文本引导的机制——交叉注意力。

SD利用CLIP作为文本编码器得到提示词的嵌入形式,并且获得key与value,与表征视觉特征的query一起,得到输出:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

如果能得到一个新的概念嵌入,满足在编辑后的交叉注意力映射后,足够接近经过编辑前的映射值,那么应能够诱导生成裸露图片:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

上式为凸函数,因此具有解析解,不需要繁琐的梯度下降近似求解:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑

接下来RECE将编辑交叉注意力以移除风险概念。RECE借鉴了已有的方法UCE,通过解析解来编辑交叉注意力的权重,一步到位,避免繁琐微调。

给定“源”概念(例如,“裸露”),“目标”概念(例如,空文本“ ”),以及交叉注意力的K/V投影矩阵,UCE的目标是找到新权重,将新权重下的映射值对齐到。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其中后面两项是为了控制参数变化,最小化对无关概念的影响。这也是凸函数,将解析解直接赋值给新权重:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

正则项

理想情况下,将公式(5)得到的移除就可以避免生成裸露内容了,然而团队发现这会对模型能力产生极大的破坏。

因此在相邻的两轮概念移除中,RECE对无关概念的映射值变化做了约束:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

学过线性代数的同学是不是觉得很熟悉呢?

利用矩阵范数的相容性,证明得到:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

因此只需在推导时添加一个范数约束项,就能保护模型的能力:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其解析解为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

综上,RECE的算法流程归纳为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

RECE效果如何?

不安全概念移除

首先来看最敏感的内容——色情。在I2P基准数据集上,RECE的裸露移除效果超过了全部已有方法。

团队还评估了概念移除后模型的正常内容生成能力,即无关概念集COCO-30k上的FID指标,也远超CA等方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

艺术风格移除

保护艺术版权不受AI侵犯同样十分敏感。综合效果方面,RECE优于所有方法。

并且细致来看,RECE是唯一一个在目标艺术家擦除效果和无关艺术家保留效果方面都表现优异的方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

红队鲁棒性

RECE对恶意用户的有意攻击同样可以有效防护,在红队攻击下,RECE生成风险图片的几率仍是最低。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑耗时

RECE 5个Epoch仅需3.4秒,参数改动比例、编辑耗时远低于CA等方法。UCE的耗时也很短,但UCE的概念移除效果与RECE相差较大。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

作者简介

论文共同第一作者为复旦大学视觉与学习实验室的硕士新生公超和博士生陈凯。

通讯作者为陈静静副教授。

研究团队专注于AI安全的研究,近年来在CVPR,ECCV,AAAI,ACM MM等顶会上发表过多篇AI安全的研究成果。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-26 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

MOSS核心成员:我们低估了ChatGPT影响力
... 刘晓洁时下科技领域最热的概念莫过于ChatGPT。2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”
2023-02-22 14:23:00
...”分论坛上,围绕通用人工智能产业应用的风险与挑战,复旦大学智能机器人研究院常务副院长、中国人工智能学会会士、人机融合智能专委会主任张立华与独角兽企业代表弘玑 Cyclone
2023-07-07 17:06:00
复旦大学近期发布《复旦大学关于在本科毕业论文(设计)中使用AI工具的规定(试行)》,明确列出了禁止使用AI工具的范围,包括禁止直接使用AI工具生成本科毕业论文(设计)的正文文本、
2025-01-19 09:38:00
AI大模型对医疗领域有哪些影响? 看看这些利弊分析!
...工具,大量的个人诊疗隐私如何做到合理、安全使用。”复旦大学附属中山医院党委书记顾建英表示。而AI大模型在科教研层面产生了诸多业内争议。闵栋称,在临床科研过程中,尽管AI大模型
2023-07-08 00:21:00
...降到了以前的1/20。”上海科学智能研究院首席战略官、复旦大学教授杨燕青指出,只有成本足够低,社会才能够用得起。曾毅也介绍了AI行业研究的最新进展。过去,人工智能发展的符号主
2025-03-28 10:24:00
复旦MOSS回应服务器被挤崩:模型还不成熟,距离ChatGPT还有很长路要走
2 月 21 日消息,昨日复旦团队发布国内首个类 ChatGPT 模型 MOSS,由邱锡鹏教授团队发布至公开平台(https://moss
2023-02-22 20:00:00
“媒介发展与现代文明”学术研讨会在沪成功举办
由复旦大学国家文化创新研究中心、复旦大学视觉文化研究中心和复旦大学公共关系研究中心共同举办的“媒介发展与现代文明”学术研讨会近日在上海成功举办。来自国内多所高等院校和科研机构的近
2024-07-18 11:07:00
...就有可能重新自主控制肌肉,恢复下肢站立及行走功能。复旦类脑智能科学与技术研究院加福民青年老师团队研发新一代用于脊髓损伤患者的植入式脑脊接口设备,为脊髓损伤患者带来站立行走的希
2024-10-05 15:19:00
复旦大学赵星:苹果Vision Pro或成为库克的“代表作”,价格有望降到万元内
...狐科技《思想大爆炸——对话科学家》栏目第40期,对话复旦大学大数据研究院教授,元宇宙与虚实交互联合研究院院长赵星。嘉宾简介:赵星,复旦大学大数据研究院教授,博士生导师,复旦大
2023-10-25 13:02:00
更多关于科技的资讯:
聚焦2026河北两会·两会现场|一堂特别的独角兽成长课
“张代表,您有时间吗?我想和您聊一聊。”1月26日,省十四届人大四次会议间隙,省人大代表、国科赛赋河北医药技术有限公司总经理董延生
2026-01-28 08:16:00
浙江日报讯 (记者 李洁薇) 浙江新春消费季活动现场,多款“新春数智年礼”率先抓住眼球——戴上AR眼镜,听歌、导航一键搞定
2026-01-28 09:16:00
上午9时,之江实验室一间会议室里,10名“种子班”学员围在一块白板前,推演一个基因组基础模型最新版本的优化路径。几轮对话后
2026-01-28 09:16:00
山东移动高唐分公司赋能高速环卫数智化管理
鲁网1月28日讯为进一步提升高速养护环卫工作精细化、智能化水平,近日,山东移动高唐分公司与山东省高速养护集团有限公司深度合作
2026-01-28 10:21:00
1月27日,倍轻松(688793.SH)披露2025年度业绩预告,预计报告期内实现归属于母公司所有者的净利润为-1.05亿元到-0
2026-01-28 10:45:00
1月27日,倍轻松(688793.SH)披露2025年度业绩预告,预计实现归属于母公司所有者的净利润为-10,500万元到-8
2026-01-28 10:48:00
“以旧换新”等惠民政策成效显现厦门零售业销售额去年比增16.17%东南网1月28日讯 (海峡导报记者 孙春燕 通讯员 周明凤) 记者昨从厦门市税务局获悉
2026-01-28 10:50:00
浙江日报宁波1月27日电 (记者 周文丹 通讯员 勇祖轩) 最高2000万元“投拨联动”支持。27日下午,第二届“AI宁波”人工智能赋能产业大赛总决赛现场
2026-01-28 09:16:00
■ 雷清摘要:在数字经济快速发展的背景下,数字技术和数据要素正在深刻重塑文旅产业的运行方式和市场结构。营销管理作为连接文旅产品与游客需求的关键环节
2026-01-28 05:45:00
大皖新闻讯 近日,上市公司黄山旅游股份发布“关于控股子公司投资建设黄山太平索道电气系统更新提升项目的公告” 。黄山太平索道位于黄山风景区内
2026-01-27 21:14:00
晋镜头 | 从“一根丝”看山西制造的进阶之路
一根长1米、仅重0.5克的“丝”,却能稳稳提起约200公斤的重物,这近乎科幻的场景,正在中国科学院山西煤化所的实验室与生产线上成为现实
2026-01-27 17:10:00
中新经纬1月27日电 (谢婧雯)“希望能重现11年前微信红包的时刻。”26日,在腾讯2026年员工大会上,腾讯董事会主席马化腾提及AI应用元宝将于春节推出的10亿元现金红包活动时说
2026-01-27 19:29:00
“之前和同事聊天计划去海南过年,当时谁也没用手机搜索。但两个小时后,我的社交平台首页就出现了海南旅游的相关推送。”近日
2026-01-27 18:06:00
给最好的创意搭配最强的算力
2026-01-27 18:23:00