• 我的订阅
  • 科技

如何让“机器不学习”?学会“遗忘”将使新一代AI更出色

类别:科技 发布时间:2024-06-14 11:54:00 来源:文汇报

如何让“机器不学习”?学会“遗忘”将使新一代AI更出色

由于人们担心人工智能(AI)驱动的聊天机器人可能会泄露私人数据,计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难,但“机器不学习”的解决方案已经开始出现。这项工作除了能解除人们对隐私和错误信息的担忧外,还能起到一个至关重要的作用——如果我们真的想让AI像人类一样学习和思考,可能需要让它们学会遗忘。

被遗忘权

由大型语言模型(LLM)支撑的新一代AI聊天机器人能根据用户的提示生成文本。这些模型是在大量数据的基础上训练出来的,其中大部分数据抓取自互联网上的公开信息。由此,它们学会了预测句子中最有可能出现的下一个词,从而流利地回答每一个问题。

与此同时,这也意味着当大模型学习到某些东西时,就无法取消学习。澳大利亚最大的国家科研机构联邦科学与工业研究组织的AI研究员兼工程师张大卫说,大语言模型根据汇总数据生成回复,因此它们无法像谷歌等搜索引擎那样轻松地遗忘或“删除”特定信息,甚至个人也无法准确追踪AI应用程序对自己的了解程度。

这在隐私方面造成一个重大问题。2018年生效的《欧盟通用数据保护条例》(GDPR)规定用户享有“被遗忘权”,即当用户要求企业清除和停止传播个人的隐私信息时,企业应当采取合理措施,及时销毁用户的个人数据,否则将面临巨额处罚。

瑞士苏黎世联邦理工学院的计算机科学家弗洛里安·特拉梅尔认为,大模型公司必须想办法解决这个问题,尤其是当这些公司开始用更敏感的信息对大模型进行训练。

更令人担忧的是,由AI驱动的聊天机器人本身也很容易受到攻击。已有研究证明,一些黑客技术可以让聊天机器人在用户设备上远程运行代码,或要求用户提交银行账户信息。

诱导“失忆”

机器学习模型对数据有很强的依赖性,尤其像ChatGPT这样拥有海量训练数据和千亿级参数的大型AI系统,面对用户频繁的删除请求,重新训练整个模型会消耗巨额资源。

那么,是否能在不用重新训练模型的情况下,移除或至少屏蔽特定信息呢?

2019年,加拿大多伦多大学的尼古拉斯·帕贝尔诺及其同事提出了一种被称为SISA的方法——它将数据集分割成不同小块,分别对每个小块进行模型训练,并像游戏一样保存节点进度,再合并结果。当遇到取消学习请求时,它可以返回节点,切断相关数据块,再从那里开始重新训练。经测试证明,这种方法大大加快了重新训练速度。

由于删除数据会严重影响机器学习模型的性能,一些团队选择了隐藏或遮蔽相关数据的策略。例如,微软和美国俄亥俄州立大学的研究人员在用于训练模型的数据中引入了噪音,使大模型随后输出的信息由数据中更泛化的模式,而不是特定的、可识别的例子所决定。这从理论上保证了大模型不会透露训练数据中的个人信息。

如何让“机器不学习”?学会“遗忘”将使新一代AI更出色

但是,这种泛化往往会在一定程度上削弱AI的学习能力。为了规避这个问题,韩国科学家尝试了一种“知识解除学习”的方法,其目的是扭转某项数据对算法的影响,而不是完全删除它,这样聊天机器人就永远不会引用它。目前,这一方法是该领域最有前途的方法之一,因为它能在更短时间内使用更少的计算资源完成工作。

为了激励研究人员提出更高效的解决方案,谷歌公司还组织了一场竞赛。这不仅表明这项挑战的重要性,也意味着或许我们将找到更多好方法,让新一代大模型拥有“遗忘”的能力。

选择性记忆

英国伦敦政治经济学院研究人工智能的哲学家阿里·博伊尔认为,虽然人类的遗忘倾向通常被视为认知缺陷,但有时也是有益的——通过遗忘,人们可以更有效地检索有用的记忆。

AI系统可能也是如此。2017年,谷歌DeepMind公司的研究人员开发了一种可以玩多种电子游戏的人工智能系统。通过存储并回忆自己玩游戏的记忆,它能更有效地归纳出知识。当研究人员改进了模型,使其优先存储和回忆一部分事件而忘记其他数据时,系统性能得到了提高。

这意味着,选择性遗忘可以提高人工智能的性能,而关键是在记忆过多和过少之间找到适当的平衡点。如果AI研究人员的最终目标是建立能像人类一样学习和思考的系统(这也是该领域的最初目标之一),那么他们就必须要设计出能选择性遗忘的系统。在博伊尔看来,遗忘不是设计缺陷,而是一个高效、运作良好的记忆系统的必要特征。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

明年量产!魔法原子新一代机器人亮相:真能进厂“打螺丝”!
...的能力。据了解,魔法原子将于2025年第一季度正式发布新一代人形机器人产品MagicBot,同步小规模量产,并在工业、商业服务等场景落地应用。自从特斯拉新一代Optimus亮
2024-12-03 09:51:00
酷克数据推出AI开发工具箱HashML 加速企业级AI应用落地投产
...言的交互式数据查询分析系统Data+AI 助力企业数智化升级新一代人工智能技术正在加速企业数字化、智能化进程,长远来看,将对企业的研发、生产、经营带来深远影响。企业需要逐场景
2023-09-12 11:31:00
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...分钟的演讲中,黄仁勋发布了一系列重磅技术产品,包括新一代基于Blackwell架构的RTX 50系列显卡、世界上最大最快的巨型芯片Grace Blackwell NVLink72
2025-01-07 19:00:00
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...大学的「炒菜机器人」ALOHA 问世,引发了一片关注。利用新一代技术,机器人似乎已经可以胜任全职管家了。在斯坦福的工作中,研究者开发了一套系统,用于机器人模仿学习需要全身控制
2024-09-03 10:00:00
星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化
...务,让用户能够基于自身需求构建紧密贴合其业务场景的新一代AI应用。一、六易——实现新一代AI平民化Sophon 3.2从数据接入获取、模型构建训练、模型运维管理、模型发布迭代
2023-05-31 16:00:00
...,或在开放网络上分享过任何内容,那么你就有可能为最新一代人工智能的诞生做出了贡献。谷歌的Bard、OpenAI的ChatGPT、微软的新版必应以及其他初创公司提供的类似工具,
2023-05-01 09:29:00
NVIDIA GTC2024 :你必须知道的AI、机器人、自动驾驶
...式平台上。NVIDIA 创始人兼首席执行官黄仁勋表示,这款新一代自动驾驶汽车处理器将搭载专为 Transformer
2024-03-20 11:13:00
人工智能自虚向实,从re:Invent 2022看如何全面实现数智融合
...、人工智能、云计算、数字孪生、5G、物联网和区块链等新一代数字技术应用和集成创新,为企业数字化转型提供技术支撑。上云、用数、赋智,精炼地描述了企业上云的三个阶段,三重境界。上
2022-12-13 15:57:00
...,提升资源效率”。此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。火山引擎尽管是“最年轻”的云厂商,其自研DPU已
2023-04-19 09:33:00
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00