我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

整合长期记忆，AI实现自我进化，探索大模型这一可能性

类别：科技发布时间：2024-10-29 09:55:00 来源：机器之心Pro

地球上最早的生命证据至少可以追溯到 35 亿年前，而直到大约 25 万到 40 万年前，智人才出现地球上。在这漫长的岁月中，生物不断地兴盛又覆灭，但整体趋势总是越来越复杂，其中最复杂的生物组件莫过于我们智人的大脑。这样的复杂性是我们的意识和智慧的来源。而这一切背后的机制是进化（evolution）。

到了现今的大模型时代，强大的基础模型已经展现出了强大的智能水平，能完成多种多样的任务。但它们也有个缺点，训练之后就基本定型了，难以随着用户的使用而演进。但毫无疑问，这项能力很重要。

近日，天桥脑科学研究院和普林斯顿大学等多所研究机构发布了一篇研究论文，详细阐述了长期记忆对 AI 自我进化的重要性，并且他们还提出了自己的实现框架 —— 基于多智能体的 Omne，其在 GAIA 基准上取得了第一名的成绩。

论文标题：Long Term Memory : The Foundation of AI Self-Evolution 论文地址：https://arxiv.org/pdf/2410.15665

首先，该团队将 LLM 的模型进化过程分成了三个主要阶段

阶段 1：在物理世界中积累认知。阶段 2：在数字世界中构建基础模型。阶段 3：模型自我进化，以实现更强大的智能。

现有的研究主要围绕着阶段 1 和 2，即如何构建更好的数据以及将其用于训练更强大的基础模型。目前人们有一个普遍的看法：在这种曲线拟合范式中，架构并不重要，关键的因素是数据集。但到了阶段 3，架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。

实现模型自我进化的原理

模型的自我进化能力是模型长期适应和个性化的关键，而这又严重仰赖于有效的记忆机制。

在这一理解的基础上，该团队提出：长期记忆（LTM）能为模型的持续进化提供历史数据积累和经验学习能力。正如人类通过经验和记忆来完善认知和行为一样，LTM 也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。

用 LTM 数据提升模型能力，使其能够自我进化

在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。

一种更优的方法是仅更新局部参数，从而在无损模型全局稳定性的前提下，让模型适应稀疏、个性化的 LTM 数据。这种方法可解决当前模型中个体数据「被平均化」的问题，使个性化信息能够更全面地表达。使用上下文学习（ICL）的检索增强生成（RAG）和用于微调的低秩适应（LoRA）等技术都可被视为局部更新个体数据的方法。

该团队的做法是采用一种混合策略来整合 LTM 数据，从而在实际应用中达到让人满意的结果。但是，该团队也表示，这可能并非一种完美的解决方案，未来可能还会出现更好的方法。

组合 LTM 数据进行实时权重更新，从而实现自我进化

当前的 LLM 通常分为训练和推理两个阶段。在推理阶段，模型权重是冻结的，防止模型根据新输入进行调整和学习。这种固定的推理过程会限制模型的适应性，尤其是在处理个性化任务和实时学习方面。

受人脑更新机制的启发，该团队认为未来的 LLM 应该将推理和训练与 LTM 结合起来，使模型能够在接收到新信息时动态调整权重。这就类似于人类的持续学习能力。

此外，这种集成还可以帮助模型在面对复杂的推理任务时自我反思并纠正错误的推理路径，从而提高准确性和效率。

这种动态的自我调整能力将大大提升模型的个性化能力和长期进化潜力。通过长期记忆，模型不仅可以从短期记忆中学习，还可以从历史数据中提取有价值的见解，随着时间的推移能更深入地理解个人偏好和行为模式。这种理解可实现模型的个性化定制和动态调整，使模型能够更有效地进化。特别是在面对新的或极端的情况时，长期记忆使模型能够参考过去的经验，快速做出调整并自我进化，从而获得更大的灵活性和适应性。

长期记忆在模型自我进化中的实现路径

该团队首先将给出 AI 自我进化和 LTM 的定义，然后探索 LTM 在 AI 自我进化中的关键作用，之后会介绍如何使用 LTM 来实现 AI 自我进化。

他们做出了以下贡献：

给出了 AI 自我进化和 LTM 的定义；提出了一个用于 LTM 的数据框架，包括数据收集、分析与合成；提出了一个用于 LTM 的多智能体协作开发框架。

AI 自我进化的基础

这里简要给出 AI 自我进化的定义，详情请参阅原论文。

AI 自我进化是指 AI 模型使用个性化数据不断学习和优化，实现多智能体协作和认知方面的突破。该过程基于一个共享式内核架构，其中各个模型通过处理个性化经验和数据不断进化，从而提升自身推理能力和适应能力，最终实现在动态环境中的自主学习和持续进化。

要实现 AI 自我进化，需要：

多智能体协作机制差异化的个性化模型自我纠错和评估机制长期记忆和学习能力

用于 AI 自我进化的 LTM

目前，LLM 主要通过两种记忆机制来管理信息：上下文存储器和基于压缩的参数存储器。虽然这些机制在短期任务中表现出色，但它们在支持长期自主学习和进化方面仍然存在不足。

正如人类使用 LTM 来塑造他们的行为和身份一样，人工智能系统也可以采用类似的方法根据「个人数据」定制其响应和行为。这里，「个人数据」不仅限于个人用户，还包括特定的机构和领域，允许模型根据更广泛的个人背景和需求调整其响应和行为。

作者深入探讨了 LTM 在 AI 自我进化中所发挥的关键作用，首先在 AI 自我进化的背景下定义了 LTM，并分析了当前 LLM 记忆机制的缺点。然后，作者讨论了通过从人类 LTM 特征中汲取灵感来增强人工智能模型的自我进化能力，旨在构建能持续学习和自我完善的人工智能系统。

该研究将 AI 自我进化中的 LTM 定义为：

LTM 是人工智能系统可以长期保留和利用的信息，使模型能够根据更广泛的背景调整其响应和行为。

这里，「个人数据」不仅限于个人用户，还包括特定的机构和领域，允许模型根据更广泛的个人背景和需求调整其反应和行为。

从数据积累的角度来看：模型和人类都与环境进行广泛的交互，为个性化提供基础数据。与人类相比，人工智能模型可以更有效地与环境交互，并且可以在纯虚拟的数字环境中执行这些交互和迭代。因此，通过设计适当的记忆细化策略，模型应该能够像人类一样积累长期记忆，甚至可能具有更高的效率和规模。

从模型更新的角度来看：人工智能擅长存储和调用海量数据，远远超过人类记忆规模。神经网络通过分布式参数管理这些数据，处理来自不同领域的输入。然而，这种存储相对刚性，缺乏实时更新的灵活性，通常需要重新训练才能实现更新。相比之下，人类的记忆力却非常强。

LTM 的构建策略

LTM 是对原始数据的有效组织和结构化，而不仅仅是表面上对原始数据进行分类和排序。相反，它是从记忆快速存储和检索以及信息高效利用的角度来设计和优化。通过建立相关信息之间的联系，有效处理数据并重新组织信息，智能体可以快速定位所需的记忆片段，从而提高响应速度和准确性。以下是几种主要的操作方法：

文本摘要数据结构化图表征矢量化模型参数化

如何利用 LTM 实现模型自我进化？

获得高质量的 LTM 数据后，下一个挑战是如何利用它来增强模型能力并实现模型的自我进化。在使用 LTM 数据以最大限度地提高其有效性和效率的过程中需要解决几个关键挑战，包括：

适应持续更新的 LTM 数据。随着用户 LTM 数据的不断积累，模型必须在学习新信息和保留先前获取的知识之间取得平衡。传统模型通常假设稳定的数据分布，但在实际场景中，新的 LTM 数据可能与早期模式显著背离，导致过拟合或灾难性遗忘等风险。有效处理这些变化对于适应动态 LTM 数据至关重要。

实时学习和高效反馈集成。由于 LTM 数据是动态积累的，模型必须快速适应用户行为的实时变化。新数据的快速集成对于智能助手等应用程序至关重要，其中无缝的用户交互是关键。此外，在完善基础模型时，应考虑隐式（例如点击次数或花费的时间）和显式的用户反馈。实时结合这两种类型的反馈使模型能够不断改进并满足个人用户的需求。

处理数据稀疏性和用户多样性。数据稀疏是持续更新的 LTM 系统中一个常见的问题，特别是对于交互历史有限或零星活动的用户来说，这使得训练模型变得困难。此外，用户多样性也会进一步增加复杂性，要求模型适应个体模式，同时仍然有效地推广到不同的用户组。

以清华大学团队的 Agent Hospital（智能体医院）作为案例，该团队展示了如何在这个模拟医疗场景中用 LTM 来提升模型的能力，其中包括医疗记录积累、医疗经验反思和基于 RAG 利用 LTM。详见原论文。

基于 LTM 实现模型自我进化的实践

获取 LTM 数据

为了提升模型保留和访问 LTM 数据的能力，该团队全面研究了各种方法，其中包括：

如何收集真实世界的 LTM 数据。如何获取合成的 LTM 数据，其中包括用真实数据提升合成 LTM 数据的生成过程、使用思维链增强合成 LTM 数据的生成过程、生成训练数据和评估数据等多个方面。如何使用 LTM 数据，该团队介绍了通过 SFT 和 RAG 使用 LTM、将 LTM 用于医疗领域的智能体自我评估、通过记忆系统来使用 LTM、通过实时权重更新来使用 LTM。

这其中包含一些实验评估和例证，详见原论文。这里我们来重点看看他们开发的基于 LTM 的多智能体框架。

基于 LTM 的多智能体框架

该团队提出一个基于 LTM 的多智能体框架 Omne。

Omne 是基于 AutoGen MultiAgent Framework 深度定制的开发框架，专门用于解决 LTM 在 AI 系统中的实际应用难题。

它扩展了一系列与记忆相关的基础设施，包括统一的记忆模型、多模态消息处理系统以及灵活的记忆存储和操作机制。Omne 的核心模块（Omne Core）如下图所示：

Omne 的核心目标是提供一套全面的解决方案，使 LTM 能够在实际工程项目中有效部署，从而增强 AI 系统的长期记忆能力和任务处理效率。

基于 Omne Core，该团队还构建了一个 Omne Assistant。

Omne Assistant 的设计目标是帮助开发聊天场景中的 AI 助手，其提供了一个现成的应用层框架。它包括 AI 助手所需的基本功能，使开发人员无需从头开始设计基础组件，就能快速构建功能齐全的聊天机器人。

Omne Assistant 带有一个 Simple Responder，这是一个通用的问答响应器，可以处理基本的用户聊天交互以实现即时通信。此外，该框架还提供了一个 Reactive Responder，它具有高级任务分析和规划功能，使其能够管理需要多步骤推理和任务编排的更复杂的用户请求。

借助这些内置组件，Omne Assistant 可让开发人员专注于实现自己的功能，从而更快地开发和部署配备长期记忆功能的 AI 助手应用。

在 GAIA 基准（包含 400 多个问答任务的通用 AI 助手测试集）上，该团队对 Omne 框架进行了评估。

为了探索 AI 的边界，他们在 Omne 框架中使用了当今最强大的 GPT-4o 和 o1-preview 模型，同时配备了 4 个工具：网络浏览、Bing 搜索引擎、基于 llamaparse 的文件读取器，一个使用 o1-preview 构建的逻辑专家。

基于这 2 个基础模型和 4 个工具，Omne 在测试集和验证集上分别取得了第一名（40.53%）和第二名（46.06%）的成绩。

值得注意的是，Omne 在最复杂、要求最高的 3 级问题上达到了 26.53% 的准确率。这证明了其通过利用强大的基础模型（尤其是具有强大推理和逻辑能力的模型）解决现实问题的潜力。

未来计划

该团队并不打算止步于此，他们已经制定了未来研究的计划，方向包括：

1. 如何更好地构建 LTM 数据？

2. 如何为 LTM 设计新的模型架构？

3. LTM 如何帮助用户提出更好的问题？

4. 如何将 LTM 与推理时间搜索相结合？

5. 如何在复杂场景中使用 LTM 实现智能体自我进化？

6. 如何在多智能体场景中使用 LTM？

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-10-29 11:45:06

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于进化,可能性,模型,整合,记忆,模型的资讯：

大语言模型技术激发治理结构变动

...理性的引导下，充分挖掘技术服务于国家治理权力运作的可能性，有助于提升治理行为的效率和精准性。对于作为国家治理工具的大语言模型技术的调度程度，则主要取决于治理者对技术本身及其运

2024-04-08 03:36:00

思必驰天琴语音助手全面接入DeepSeek：中枢大模型驱动车

...不再局限于简单的指令执行,更可实现场景共建,构建起可进化的智能生态——数据驱动模型迭代,同时结合故障诊断与环境感知实现更智慧的交互和服务。未来,思必驰将持续深化“感知-思考-

2025-03-03 17:09:00

APUS加速实现大模型普惠，让AI应用更简单

...底层建设需求，一方面激发更多服务客户智能应用场景的可能性，让大模型落地应用更简单。APUS转型AI的背后是一场长达九年的技术长跑。从2018年到2023年APUS五年蓄力入局

2023-09-27 11:43:00

「搜索」迈入 3.0 时代

...做不到直接给用户提供答案直到大模型的出现，带来新的可能性，让搜索实现从「提供信息」向「直接获取答案」的转变。引入 AI 后的新搜索，可以通过理解上下文、推理分析，给出精准的答

2024-09-06 09:58:00

基因测序、生物打印机……数字生命其实没那么遥远

...走出电影院，重新思考“数字生命计划”在现实中落地的可能性，虽然难度显而易见但也有迹可循。首先，人的意识本质上是大脑中神经电化学信号的产物，致力于破解大脑神经通路的人类连接体项

2023-02-02 07:00:00

具身智能如何再进化？庞江淼：“虚实贯通”将成推动机器人自主演

...划能力，同时能与人交互、有推理、在未来有更难的自主进化、真正变成具身的大脑，是实验室具身智能团队正在研究的部分内容。“大模型需要通专融合、再虚实贯通，我们要让大模型从数字空间

2025-02-26 14:49:00

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...绿色荧光蛋白。ESM3能够帮助科学家加速工作，开辟新的可能性——我们期待看到它在未来对生命科学研究的贡献。」当数十亿个蛋白质来自进化时间轴上的不同位置，具有丰富的多样性时，模

2024-06-27 09:31:00

搭建免疫药物通用模型，生物科技企业「Aureka」完成千万美

...率较低。AI技术的应用一度让行业看到了缩短药物研发的可能性，但另一个通病是，实验反馈并不如自然语言处理反馈那么快，导致AI的产出很难得到大规模的验证和反馈，“AI制药公司没有

2023-06-25 08:51:00

Claude 3大模型引起学界关注，业内人士：或将开启科研新

...越的智能水平，为计算机视觉和图像理解应用开辟广阔的可能性。（来源：Anthropic 官网）据了解，Claude 3 模型家族共有三款模型

2024-03-12 10:59:00

更多关于科技的资讯：

鲁南眼科自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊

鲁网1月1日讯2025年12月31日，鲁南眼科医院成功举办自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年庆典

2026-01-02 16:41:00

新年第一天燕赵沐朝晖｜“雄安一号”星测试太阳翼

编者按岁序更替，华章日新。2026年是“十五五”开局之年。锐始者必图其终，成功者先计于始。新年第一天，燕赵大地欣欣向荣

2026-01-02 07:05:00

注意缺陷与多动障碍这个疾病越来越常见都说长大就好了为何

2025年12月31日凌晨，罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件，首次公开坦承自己受注意缺陷与多动障碍（ADHD）困扰多年

2026-01-02 08:06:00

湘湖文化“走入”城市

近日，湘湖首部AI动画《湘湖漫游记》第五集上线，该系列作品正式收官。本片不仅是杭州湘湖（白马湖）研究院在“文化+科技”融合上的一次重要突破

2026-01-02 06:35:00

场景融合解锁消费新体验

在杭州湖滨银泰in77的B区、D区之间，复古的国王十字车站、9站台出现在现场，仿佛下一秒就有巫师推着行李箱穿墙而过；一辆编号5972的霍格沃茨特快列车静静停靠在街区中央

2026-01-02 06:35:00

2025年度票房破518亿元动画电影成亮点安徽全国排名第

大皖新闻讯国家电影局2026年1月1日公布，2025年电影票房为518.32亿元，同比增长21.95%，城市院线观影人次为12

2026-01-01 17:14:00

免费抢鲜体验！香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场

鲁网1月1日讯（记者李文静）2025年12月31日晚，国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶，在山东临沂泰盛广场开启奶茶快闪体验活动

2026-01-01 15:52:00

厦门动漫嘉年华启幕众多热门国漫IP集中参展

厦门动漫嘉年华各项活动精彩纷呈。（记者林铭鸿摄）厦门网讯（厦门日报记者林露虹）展览面积超5万平方米，汇聚众多热门国漫IP

2026-01-01 08:41:00

助力低空应急产业发展——三明市应急管理局引进低空防御项目

东南网1月1日讯 2025年12月30日，由三明市应急管理局引进，南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司

2026-01-01 09:33:00

太长高速太原收费站完成智慧化升级

近日，太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心，围绕高峰期通行效率低、车辆拥堵等运营痛点

2026-01-01 07:17:00

沈洁任蓟州区代理区长扫码阅读手机版

据“掌上蓟州”微信公众号消息，天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定：沈洁为天津市蓟州区人民政府代理区长。

2025-12-31 23:10:00

福建省消委会发布元旦消费提示：警惕“伪智能”陷阱科技消费需

东南网12月31日讯（本网记者卢金福）元旦佳节将至，消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势

2025-12-31 23:29:00

皖企长鑫科技向上交所递交IPO招股书

大皖新闻讯 2025年12月30日，总部位于合肥的长鑫科技集团股份有限公司（以下简称“长鑫科技”）正式向上海证券交易所递交招股书

2025-12-31 21:33:00

双语视频丨这一年，我们没有走遍世界，但世界，走进了《Glob

大河网讯这一年，我们没有走遍世界，但世界，走进了《Global Talk》。2025年，《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事

2025-12-31 22:33:00

上药控股山东总部携手浪潮智慧建筑打造智慧、绿色医药园区新标杆

近日，上药控股山东总部携手浪潮智慧建筑，构建涵盖16大智能化系统的智慧园区体系，以智慧云平台为中枢推进全要素数字化升级

2025-12-31 22:59:00

头条订阅服务

整合长期记忆，AI实现自我进化，探索大模型这一可能性