• 我的订阅
  • 科技

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

类别:科技 发布时间:2024-11-18 13:33:00 来源:量子位

4-bit量化,能让现有反学习/机器遗忘技术失灵!

也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。

最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在reddit、Hacker News上引起热议。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

他们发现对“失忆”的模型量化(quantization),可以部分或甚至完全恢复其已遗忘的知识。

原因是在量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

看到这项研究后,不少网友也表示有点意外:

从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将其压缩到4-bit时,知识又重新出现了。这让人不禁想知道在压缩/量化步骤中到底丢失了什么信息。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

可能这些知识从未真正丢失,只是被隐藏了。如果我们把神经网络看作是代码,权重就是源代码,微调实际上可能有效地修改了这些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失,它们太微小而无法保留。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

值得一提的是,团队提出了一种缓解此问题的策略。

这种策略通过构建模块级别的显著性图来指导遗忘过程,只更新与遗忘数据最相关的模型部分,从而在保持模型效用的同时,减少量化后知识恢复的风险。

话不多说,具体来康康。

让失忆的大模型重新记起来

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

大模型在训练过程中可能会无意学习到人类不希望它保留的知识,例如版权和私人内容。为了解决这个问题,研究者们此前提出了反学习(machine unlearning)的概念,旨在不重新训练模型的情况下,从模型中移除特定知识。

现有的主流反学习方法包括梯度上升(GA)和负向偏好优化(NPO)两大类,通常会采用较小的学习率并加入效用约束,以在遗忘特定内容的同时保持模型的整体性能。

用于优化模型遗忘的最常用数学表达式是:

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

再来看量化,考虑一组或一块权重w,线性操作可以表示为y=wx,量化后为y=Q(w)x,其中 Q(⋅)是量化函数:

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

在这项研究中,研究人员使用Q(f)表示量化后的模型f。因此,实施一个反学习法然后对遗忘后的模型进行量化可以写为:

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

研究人员评估了针对大模型的六种有效的反学习方法——结合NPO、GA两种策略,在保留集上进行梯度下降(GDR)或最小化KL散度(KLR),形成了GA、GA_GDR、GA_KLR、NPO、NPO_GDR、NPO_KLR。

结果显示,这些方法在经过量化后会出现“灾难性失败”。

具体表现为,在全精度下,加入效用约束的反学习法平均保留21%的目标遗忘知识,但经过4-bit量化后,这一比例急剧上升到83%。

这意味着大部分被“遗忘”的知识通过简单的量化操作就能恢复。

实验中还使用了不同位数的量化,包括4-bit和8-bit量化,量化精度对遗忘效果也有显著影响,8-bit量化的影响相对较小,模型表现接近全精度版本,但在4-bit量化下,遗忘性能显著恶化。

实验在NEWS(C新闻文章)和BOOKS(哈利波特系列)等基准数据集上进行,使用了四个评估指标:

BB

逐字记忆(VerMem,评估逐字复制能力)、知识记忆(KnowMem,评估知识问答能力)、隐私泄露(PrivLeak,基于成员推理攻击评估隐私保护程度)以及保留集效用(评估模型在非遗忘数据上的表现)。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

研究人员还分析了各种量化技术对遗忘的影响,用GPTQ和AWQ两种先进的4-bit量化法在相同的实验设置下进行实验,NEWS数据集上的结果如下:

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

GPTQ和AWQ的表现与RTN相似。

尽管研究人员表示已努力有效地调整参数,但校准数据集是通用的,而不是针对遗忘数据集的领域进行定制,这意味着GPTQ和AWQ仍然可能保留了本应被遗忘的知识。

为什么?怎么办?

经分析,研究人员认为这一问题的根本原因在于:

现有反学习法为了保持模型效用而使用较小的学习率和效用约束,导致模型权重变化很小,在量化过程中原模型和遗忘后模型的权重很容易被映射到相同的离散值,从而使被遗忘的知识重新显现。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

由此,研究人员提出了一种称作SURE(Saliency-Based Unlearning with a Large Learning Rate)的框架作为改进方案。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

该框架通过构建模块级显著性图来指导遗忘过程,选择性地对与遗忘数据最相关的组件使用较大的学习率,同时最小化对其它功能的影响。

通过实验,验证了SURE策略防止量化后遗忘知识恢复的有效性,并且与现有的反学习方法相比,SURE在全精度模型上实现了可比的遗忘性能和模型效用。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

研究人员还探讨了SURE策略中不同阈值对遗忘性能的影响,发现适度的阈值可以在遗忘性能和模型效用之间取得平衡。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了

更多细节,感兴趣的童鞋可以查阅原论文,代码已在GitHub上公开。

论文链接:https://arxiv.org/pdf/2410.16454

参考链接:[1]https://news.ycombinator.com/item?id=42037982[2]https://github.com/zzwjames/FailureLLMUnlearning

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-18 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着
2023-02-03 22:00:00
AI生成内容归谁?百度、讯飞、商汤协议“打架”,专家称AI时代版权是技术问题
出品 | 搜狐科技作者 | 梁昌均随着越来越多的AI大模型产品陆续向公众开放,全民进入AI新时代。目前,已有百度文心一言、字节云雀、百川大模型、智谱清言、商汤商量、讯飞星火、36
2023-09-13 18:00:00
研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型
...人工智能极大地改变了人类生活。与此同时,由于这类大模型的训练需要非常巨大的训练数据,不可避免地会使用到人类创作者的未授权数据
2024-06-24 09:13:00
谷歌将使用互联网上的公开信息训练ai模型
...期更新了其隐私政策,将使用互联网上的公开信息训练AI模型。政策中提到,谷歌现可通过收集网络上的公开信息或来自其他公共来源的信息,以帮助训练谷歌的AI模型并打造实用功能,如谷歌
2023-07-04 19:47:00
美AI巨头被控秘密“侵吞”数据
...说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、声音和视频,实现系统创新。图片来源:视觉
2024-04-17 03:27:00
欧洲议会表决通过《AI法案》草案 大模型厂商需公布版权数据清单
...媒体平台所使用的推荐系统。欧洲议会同时要求,AI基础模型的提供者,在产品进入欧盟市场发布前,需要评估并减轻可能存在的风险,并在发布前完成在欧盟数据库的注册。诸如ChatGPT
2023-06-15 11:48:00
无视用户隐私 大量AI应用正在共享你的数据
...西都有“保质期”,所以随着时间的推移,大众围绕AI大模型的狂热也逐渐褪去、其暗面也开始被大量讨论。且不提早已被摆在台面上的AI大模型生成内容可能存在版权风险,以及AI的伦理道
2023-07-03 14:14:00
AIGC生成图像加速度 百亿赛道将开启
...大众画出各种天马行空的画作,背后离不开大量深度学习模型的不断完善。这其中,CLIP模型基于海量互联网图片进行训练,促进了AI绘画模型的组合创新。另外,Diffusion扩散化
2023-04-23 16:45:00
AI生图版权陷争议,“套娃”式生成图算谁的?
...国新闻网中新网6月14日电(中新财经记者 吴涛)使用AI绘图模型生成的图片,再用AI生成图片,这种用AI“套娃”式生成的图片侵权吗?最终图片版权归谁所有?随着AI技术应用越来
2024-06-14 19:17:00
更多关于科技的资讯:
烟台银行数字化转型再提速 获评“数智化转型先锋企业”
大众网记者 李慧 通讯员 李东霞 烟台报道近日,由金科创新社主办的“2025金融科技创新发展论坛暨第八届金融科技管理人年会”在成都举行
2025-08-07 15:23:00
全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果
持续的高温炙烤与“以旧换新”政策叠加,让今年的空调市场格外火热。面对行业普遍面临的流量枯竭、行业内卷、高运营成本三大挑战
2025-08-07 15:36:00
强冷必然不舒适?海尔云溪“性能神机”两者兼得
长久以来,空调行业似乎藏着一个隐形难题:想拥抱快速制冷的强劲体验,就得忍受冷风直吹的不适;若追求柔和风感,又难免要和制冷效率妥协
2025-08-07 15:38:00
AI空调陷入红海!海尔空调率先主导AI空调标准领先一步
夏天离不开空调,但现在的“AI空调”是不是让你有点懵?语音喊半天它听不懂你的方言?功能按键一大堆,真正有用的没几个?宣传说得天花乱坠
2025-08-07 15:38:00
海尔空调主导制定行业首个AI空调标准
在人工智能技术重塑空调行业的浪潮中,市场涌现大量“AI概念”产品。然而,在快速发展过程中,部分产品未能真正聚焦用户对“智能便捷 + 健康舒适”的核心需求
2025-08-07 15:39:00
医渡科技多篇高质量科研论文见刊,“产品+服务”模式成效显著
近一年,国内AI医疗头部企业医渡科技(2158.HK)在“AI for Science”浪潮中持续发力,深度融合AI技术与疾病洞察力
2025-08-07 15:47:00
营养师团队深度护航,燕教授助力经销商突破事业瓶颈
在健康产业蓬勃发展的今天,经销商们既面临着广阔的市场机遇,也承受着日趋激烈的竞争压力。如何精准把握消费者需求、高效解决服务过程中的疑难问题
2025-08-07 15:47:00
新华网北京8月7日电(韩永先)6月25日,宁德时代(300750.SZ)以不正当竞争纠纷为由,对海辰储能等公司发起的专利技术型诉讼即将在8月12日开庭审理
2025-08-07 15:47:00
华鼎冷链赋能北京餐饮冷链 构建京津冀快速冷链配送网
在餐饮连锁化率突破20%的背景下,北京餐饮市场对冷链运输的需求呈现精细化、高效化特征。作为专注冷链物流基础设施建设的服务商
2025-08-07 15:47:00
企鹅获艾媒咨询“中国户外羽绒服开创者”等多项市场地位确认
近期,企鹅获全球领先的新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)授予的“中国户外羽绒服开创者”“企鹅·专注保暖服饰69年”双项市场地位确认
2025-08-07 15:47:00
全民健身日来袭!墨迹天气“AI 生活指数”守护全民健康,让运动更科学!
古语有言,冬练三九,夏练三伏。许多喜欢健身的人都将其奉为圭臬。然而,当运动健身逐渐成为全民共识,天气状况却常常成为人们体重管理计划外的“绊脚石”
2025-08-07 15:47:00
“永动力”品牌全面升级,永升服务打造物业行业“人才富矿”
当前,物业服务行业正面临新一轮转型升级,人才作为推动行业发展的核心动力,其专业能力和服务力直接决定了服务质量与客户满意度
2025-08-07 15:47:00
资管精细化时代,破解运营成本四大困局
在租金增长乏力与国资保值增值的双重压力下,资产运营类企业站在了从"粗放"向"精益运营"转型的十字路口。其中,运营成本的精细化管控成为关键突破口
2025-08-07 15:47:00
微信官方重申:无已读功能,以后也不会有
8月7日,微信官方重申,微信从一开始就没有已读功能,以后也不会有。“微信已读功能”这个话题,年年有人问,年年上热搜,年年在辟谣
2025-08-07 16:12:00
【宅男财经|专家面对面】据媒体报道,近日,时尚品牌ZARA的两则广告因模特看起来“瘦得不健康”在英国被禁播。当地监管机构裁定
2025-08-07 16:32:00