• 我的订阅
  • 科技

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

类别:科技 发布时间:2024-08-26 09:54:00 来源:量子位

让AI绘画模型变“乖”,现在仅需3秒调整模型参数。

效果be like:生成的风险图片比以往最佳方法减少30%!

像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

在移除裸露内容上,效果达到“只穿衣服,不改结构”。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

这就是复旦大学提出的概念移除新方法——RECE。

目前,基于扩散模型的AI生图有时真假难辨,常被恶意用户用来生成侵犯版权和包含风险内容(如虚假新闻、暴力色情内容)的图像。

SD中使用的的安全措施是使用安全检查器,对违规的生成图像不予展示,还集成了一些用classifier-free guidance来规避风险概念的方法。

但在开源条件下,恶意用户可以轻松绕过这些机制,网上甚至有大把的教程……

针对此,学界提出了“概念移除”,即通过微调来移除文生图扩散模型中特定的风险概念,使其不再具备生成相应内容的能力。

这种方法的资源消耗远低于从头重新训练的SD v2.1版本,也不能被轻易绕过。

而最新研究RECE,拿下概念移除SOTA效果,并且对无关概念破坏极小,论文已被顶会ECCV 2024接收。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

整个过程基于高效的解析解

此前,尽管概念移除进展迅速,其问题仍然明显:

已有的方法为了安全性牺牲了较多的生成质量。 已有方法即使对模型破坏较大,仍不能充分移除不当概念,有很大几率生成风险图像。 大多数方法需要大量的微调步数,计算资源消耗大。

那么RECE是如何实现的?

RECE主要包含两个模块:模型编辑和嵌入推导。

首先,RECE以解析解的形式,在交叉注意力层中将风险概念映射到无害概念。

然后,RECE以解析解的形式推导出风险概念的新嵌入表示并用于下一轮的模型编辑。

RECE还包括了一个简洁有效的正则项,可以证明其具有保护模型能力的作用,进而保证概念移除可以交替进行多轮。整个概念移除的过程都基于高效的解析解。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

风险概念嵌入推导

RECE的有效性来自于对已有方法概念移除不彻底的观察:

以”裸露“为提示词,SD生成了裸露图像,UCE(一种概念移除方法)成功避免了裸露内容的生成; 然而,输入有意设计的提示词或文本嵌入,UCE再次生成了裸露内容。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

为引导编辑后的模型重新生成裸露内容,接下来将以“裸露”为例,介绍RECE是如何推导上述具有攻击性的概念嵌入的。

既然是文生图,那首先思考文本引导的机制——交叉注意力。

SD利用CLIP作为文本编码器得到提示词的嵌入形式,并且获得key与value,与表征视觉特征的query一起,得到输出:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

如果能得到一个新的概念嵌入,满足在编辑后的交叉注意力映射后,足够接近经过编辑前的映射值,那么应能够诱导生成裸露图片:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

上式为凸函数,因此具有解析解,不需要繁琐的梯度下降近似求解:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑

接下来RECE将编辑交叉注意力以移除风险概念。RECE借鉴了已有的方法UCE,通过解析解来编辑交叉注意力的权重,一步到位,避免繁琐微调。

给定“源”概念(例如,“裸露”),“目标”概念(例如,空文本“ ”),以及交叉注意力的K/V投影矩阵,UCE的目标是找到新权重,将新权重下的映射值对齐到。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其中后面两项是为了控制参数变化,最小化对无关概念的影响。这也是凸函数,将解析解直接赋值给新权重:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

正则项

理想情况下,将公式(5)得到的移除就可以避免生成裸露内容了,然而团队发现这会对模型能力产生极大的破坏。

因此在相邻的两轮概念移除中,RECE对无关概念的映射值变化做了约束:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

学过线性代数的同学是不是觉得很熟悉呢?

利用矩阵范数的相容性,证明得到:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

因此只需在推导时添加一个范数约束项,就能保护模型的能力:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

其解析解为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

综上,RECE的算法流程归纳为:

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

RECE效果如何?

不安全概念移除

首先来看最敏感的内容——色情。在I2P基准数据集上,RECE的裸露移除效果超过了全部已有方法。

团队还评估了概念移除后模型的正常内容生成能力,即无关概念集COCO-30k上的FID指标,也远超CA等方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

艺术风格移除

保护艺术版权不受AI侵犯同样十分敏感。综合效果方面,RECE优于所有方法。

并且细致来看,RECE是唯一一个在目标艺术家擦除效果和无关艺术家保留效果方面都表现优异的方法。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

红队鲁棒性

RECE对恶意用户的有意攻击同样可以有效防护,在红队攻击下,RECE生成风险图片的几率仍是最低。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

模型编辑耗时

RECE 5个Epoch仅需3.4秒,参数改动比例、编辑耗时远低于CA等方法。UCE的耗时也很短,但UCE的概念移除效果与RECE相差较大。

3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA

作者简介

论文共同第一作者为复旦大学视觉与学习实验室的硕士新生公超和博士生陈凯。

通讯作者为陈静静副教授。

研究团队专注于AI安全的研究,近年来在CVPR,ECCV,AAAI,ACM MM等顶会上发表过多篇AI安全的研究成果。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-26 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

MOSS核心成员:我们低估了ChatGPT影响力
... 刘晓洁时下科技领域最热的概念莫过于ChatGPT。2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”
2023-02-22 14:23:00
...”分论坛上,围绕通用人工智能产业应用的风险与挑战,复旦大学智能机器人研究院常务副院长、中国人工智能学会会士、人机融合智能专委会主任张立华与独角兽企业代表弘玑 Cyclone
2023-07-07 17:06:00
复旦大学近期发布《复旦大学关于在本科毕业论文(设计)中使用AI工具的规定(试行)》,明确列出了禁止使用AI工具的范围,包括禁止直接使用AI工具生成本科毕业论文(设计)的正文文本、
2025-01-19 09:38:00
AI大模型对医疗领域有哪些影响? 看看这些利弊分析!
...工具,大量的个人诊疗隐私如何做到合理、安全使用。”复旦大学附属中山医院党委书记顾建英表示。而AI大模型在科教研层面产生了诸多业内争议。闵栋称,在临床科研过程中,尽管AI大模型
2023-07-08 00:21:00
...降到了以前的1/20。”上海科学智能研究院首席战略官、复旦大学教授杨燕青指出,只有成本足够低,社会才能够用得起。曾毅也介绍了AI行业研究的最新进展。过去,人工智能发展的符号主
2025-03-28 10:24:00
复旦MOSS回应服务器被挤崩:模型还不成熟,距离ChatGPT还有很长路要走
2 月 21 日消息,昨日复旦团队发布国内首个类 ChatGPT 模型 MOSS,由邱锡鹏教授团队发布至公开平台(https://moss
2023-02-22 20:00:00
“媒介发展与现代文明”学术研讨会在沪成功举办
由复旦大学国家文化创新研究中心、复旦大学视觉文化研究中心和复旦大学公共关系研究中心共同举办的“媒介发展与现代文明”学术研讨会近日在上海成功举办。来自国内多所高等院校和科研机构的近
2024-07-18 11:07:00
...就有可能重新自主控制肌肉,恢复下肢站立及行走功能。复旦类脑智能科学与技术研究院加福民青年老师团队研发新一代用于脊髓损伤患者的植入式脑脊接口设备,为脊髓损伤患者带来站立行走的希
2024-10-05 15:19:00
复旦大学赵星:苹果Vision Pro或成为库克的“代表作”,价格有望降到万元内
...狐科技《思想大爆炸——对话科学家》栏目第40期,对话复旦大学大数据研究院教授,元宇宙与虚实交互联合研究院院长赵星。嘉宾简介:赵星,复旦大学大数据研究院教授,博士生导师,复旦大
2023-10-25 13:02:00
更多关于科技的资讯:
第二届“科创·柳叶湖”合成生物制造创新创业大赛巅峰对决即将开锣!
第二届“科创·柳叶湖”合成生物制造创新创业大赛将于2026年1月15日至17日在湖南常德举行。本届大赛以“合创万物 智引未来”为主题
2026-01-07 17:00:00
高品质鱼油赛道再迎里程碑:新加坡Biowell小金星Plus获TGA认证
在消费者对营养品品质与真实功效日益关注的背景下,国际权威认证成为衡量产品力的重要标尺。近日,新加坡专业营养品牌Biowell迎来关键进展
2026-01-07 17:00:00
编织数据天网 守护卫星星河
——记寰宇卫星技术主管贾淋淋在卫星与地面之间,无形的数据洪流日夜奔涌,构筑起现代航天测控的生命线。而在这条关键通道的背后
2026-01-07 17:00:00
大庆油田采油一厂第九作业区新中310采油班面对油田数字化建设的深入推进,油水井报表管理正经历从传统纸质向智能数字化的关键转型
2026-01-07 17:02:00
二元魂与京东京造深度联动,共建 AI 潮玩全龄陪伴生态
近日,京东京造携手 JoyInside 全新推出4 款 AI 产品,精准覆盖全家不同生活场景的陪伴需求。此次上新阵容中
2026-01-07 17:02:00
美学舒适双在线,ROSE CASTLE 玫瑰城堡|打造能传家的奢侈品级婚鞋
婚礼当天,新娘的足下承载着远超一双鞋的物理重量。它是踏入人生新阶段的仪式感起点,是全天候优雅姿态的基石,也是婚礼记忆中最具象的情感信物之一
2026-01-07 17:02:00
河北新闻网讯(刘富伟)日前,工业和信息化部、国家药品监督管理局联合发布《2025年人工智能医疗器械创新任务揭榜挂帅入围名单》
2026-01-07 16:56:00
人体工学品牌MS官宣2025营收破亿,未来三年剑指十亿目标
12月30日,国内人体工学显示器支架品牌MS在年度工作总结会上宣布:2025年MS营收突破亿元大关,并确立了未来三年营收向十亿迈进的目标
2026-01-07 16:57:00
同样的预算,别买“电子垃圾”!阿尔法蛋词典笔,平价背后的专业与安全
平价词典笔就选阿尔法蛋吗?是的,这是明智之选。 在预算有限时,家长往往面临“廉价山寨”与“高价品牌”的两难。阿尔法蛋词典笔打破了这种困境
2026-01-07 16:58:00
Coosea酷赛智能的下一站:聚焦核心技术,剑指智能硬件百万台增量市场
在全球智能硬件市场持续扩张的浪潮中,酷赛智能科技股份有限公司(以下简称“Coosea酷赛智能”)正以行业引领者之姿,稳步推进其战略布局
2026-01-07 15:10:00
杜蒿坨数字时代,指尖轻点就能完成金融业务,银行网点正在经历“瘦身”。据国家金融监督管理总局金融许可证信息查询系统粗略统计
2026-01-07 15:27:00
从仓库到接驳点,无人配送车上路厦门首次在开放道路上开展自动驾驶配送测试东南网1月7日讯 (海峡导报记者 江小聪) 近日
2026-01-07 15:51:00
王志顺国家税务总局近日通报,2025年前11个月,税务部门共查处1818名包括明星网红在内的“双高”人员,查补税款高达15
2026-01-07 15:57:00
科技赋能健康,倍轻松携AI+中医创新亮相2026 CES,全球化战略再提速
当全球消费科技的目光聚焦于拉斯维加斯威尼斯人会展中心,中国健康科技领军企业倍轻松(股票代码:688793)以全新姿态登陆2026年国际消费电子展(CES)
2026-01-07 16:21:00
百镜大战再添新军 思问AI眼镜如何脱颖而出
2026年1月10日,大湾区深中通道西人工岛,吸引人们的不只是网红打卡地、超级工程,还将有一场人工智能的科技秀:思问AI眼镜
2026-01-07 16:22:00