• 我的订阅
  • 科技

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

类别:科技 发布时间:2024-10-11 12:03:00 来源:机器之心Pro

单智能体更简单、更易于维护。

最近,「多智能体系统」是人工智能领域最热门的流行词之一,也是开源框架 MetaGPT 、 Autogen 等研究的焦点。

但是,多智能体系统就一定是完美的吗

近日,来自卡内基梅隆大学的副教授 Graham Neubig 在文章《Don't Sleep on Single-agent Systems》中强调了单智能体系统也不可忽视。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

GrahamNeubig 从以下几个方面展开:

当代 AI 智能体发展的元素,包括大语言模型、提示以及动作空间; 多智能体系统示例; 多智能体系统存在的问题; 如何从使用多个专门的智能体过渡到一个强大的智能体,以及一些需要解决的问题。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

CMU机器学习和计算机系助理教授陈天奇对这项研究进行了转发并评论:「这是一篇关于如何让单智能体系统更强大的深刻见解,对机器学习系统也有很好的启示。提示前缀缓存将成为与其他一般推理优化技术相互作用的一项关键技术」。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

基于 LLM 的智能体

大多数智能体都是基于大语言模型构建的,如 Anthropic 的 Claude 或 OpenAI 的语言模型。但语言模型不足以构建一个出色的智能体,构建一个智能体至少需要三个组件:

大语言模型LLM; 提示:可以是用于指定模型一般行为的系统提示,或者从智能体周围环境中提取的信息类型; 动作空间:上述两项是研究者提供给 LLM 的辅助工具,以便智能体在真实世界中产生动作。

一般来说,当涉及多智能体系统时,至少要改变这三个组成部分中的其中一个。

多智能体示例

假设你正在构建一名 AI 软件开发助手,这里作者以 CodeR 为例,这是一个用于 AI 软件开发的多智能体框架。它包括多个智能体,所有智能体都使用相同的底层 LM,但提示和动作空间各不相同:

管理器(Manager):该智能体的提示指定它应该为其他智能体编写一个规划来执行,以及输出规划的动作空间; 复现器(reproducer):该智能体有一个提示,告诉它重现该问题,以及一个将代码写入重现错误文件 reduce.py 的动作空间; 故障定位器(Fault Localizer):该智能体有一个提示,告诉它找到导致错误的文件,以及一个使用软件工程工具进行故障定位和列出文件以供以后使用的动作空间; 编辑器(Editor):该智能体有一个提示,用于接收复现器和故障定位器的结果,并有一个动作空间,允许它对文件进行编辑; 验证器(Verifier):此智能体具有提示,可接收其他智能体的结果,以及输出问题是否已解决的动作空间。

这是构建一个系统时所需要的结构,但是在构建这样的系统时存在一些困难。

多智能体系统存在的一些问题

在构建多智能体系统时,你可能会遇到许多问题,比如:

获得正确的结构:多智能体系统通过添加结构来解决问题。当智能体面临的问题与指定的结构完全匹配时,效果会很好,但问题是如果不匹配怎么办?

上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递给其他智能体,则通常会导致重要的上下文信息丢失,而这些信息可能对下游智能体有用。

可维护性:最后,这些智能体通常都有自己独立的代码库,或者至少有独立的提示。因此,多智能体系统可能拥有更大、更复杂的代码库。

有趣的是,很多这些挑战也适用于人类组织!我们都有过这样的经历:团队组织混乱,沟通不畅,或者当某个成员离开时,无法维持必要的技能。

如何打造出色的单智能体系统

人们为什么要打造多智能体系统?一个需要说明的重要原因是:专用于特定任务的智能体的表现通常很好,只要有合适的结构和工具,它们就能很好地完成相应的任务。

单智能体有能力竞争吗?

可能比我们预想的还更容易一些,作者表示这里已经有一个很好的原型:https://github.com/All-Hands-AI/OpenHands/tree/main/agenthub/codeact_agent

下面我们就来看看,要打造出优秀的单 LLM、单动作空间和单提示工程技术,需要些什么。

单 LLM:这是相对比较容易的部分。近段时间已经出现了一些表现出色的通用 LLM,包括 Claude 和 GPT-4o 等闭源模型以及 Llama 和 Qwen 等开源模型。虽说这些模型也不是万能的,但它们也确实能完成多种多样的任务。就算它们缺乏某个功能,也可以通过持续训练来增添,同时不会对其它功能产生太大影响。

单动作空间:这也不难。如果我们有多个使用不同工具的智能体,那么我们可以 (1) 为模型提供相对通用的工具,以帮助它们解决问题;(2) 如果不同的智能体有不同的工具组合,则可以将他们连接起来。比如,在 OpenHands 中,可以向智能体提供写代码、运行代码和执行网络浏览的工具。这样的通用方法可让模型使用为人类开发者开发的软件工具,从而增多它们的功能,做到其它多智能体能做到的事。

单提示工程技术:这是比较困难的地方!我们需要确保智能体在如何解决任务上获得正确的指示,同时从其环境中获得正确的信息。

下面给出了两个选择:

将所有提示词连接起来使用:如果我们有一个多智能体系统,要使用 10 个不同的提示词,那么为什么不将它们连接组合到一起呢?近期的长下文模型已经有能力处理多达几十万 token 了,比如 Cluade 能处理 20 万 token,而 Llama 是 12.8 万。OpenHands 也使用了此方法。但这种方法也有一些缺点。首先是成本,更长的提示词需要更多金钱和时间,不过现在有一些技术(比如 Anthropic 的提示词缓存技术)可以降低其成本。这种方法的另一个缺点是,如果提示词太多,则 LLM 可能无法关注到重点,但随着模型能力提升,LLM 在确定长上下文中的重要信息方面越来越强了。 检索增强式提示:另一种可能的选择是使用检索。如同检索增强式生成(RAG)系统一样,可以出于效率或准确度的目的对长上下文进行裁剪。在选择提供 LLM 的示例方面,这里有一些研究进展:https://arxiv.org/abs/2209.11755

总结

本文并不是说多智能体就没有用武之地了。比如在一个智能体可以访问专有信息,而另一个智能体则代表了另一个人的情况下,多智能体系统肯定大有作为!

本文的目的是批判性地思考让系统更加复杂这一趋势。有时候简单就是最好的 —— 有强大的模型、强大的工具和多种多样的提示词就足够了。

参考链接:https://www.all-hands.dev/blog/dont-sleep-on-single-agent-systems

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-11 14:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“法管家”上线,租房合同风险秒变“纸老虎”!
...标注到模型训练的全链条服务体系。”团队核心成员林川副教授说。“法管家”法律大模型的训练师们正在对大模型进行“喂养”训练该科技成果从“云端”到“身边”,是校企合作推动科技创新和
2025-03-15 12:26:00
数智化时代 AI 赋能计算机教育研讨会在桂林成功举办 助力广西教育现代化新征程
...打造虚实结合、软硬协同的教学新模式。苏州大学王红玲副教授则以课程为例,提出“痛点诊断-方案创新-实践验证”的智能化教学全流程重构方案。通识教育与产业赋能:湖南大学罗娟教授聚焦
2025-06-12 11:14:00
第三届中国汽研汽车指数年会召开,多项重磅成果权威发布
...国汽研信息智能事业部首席专家朱西产、中南大学交通院副教授、高速列车研究中心副主任伍钒、吉林大学唐敖庆领军教授许楠分别作《IEEE ITSS标准:系统验证与确认》《组合驾驶辅助
2025-07-12 20:19:00
AI赋能教育,英才这场盛会开启教学新篇章!
...究中心主任高天雷副研究员,济南大学硕士生导师丁广乾副教授,山东协和学院计算机科学教研室主任王红副教授,华为济南创新中心华为云高级解决方案架构师韩永,华清远见教育集团济南分公司
2025-03-31 18:44:00
智能制造如何起飞?第九届中欧思创会洛阳站举办
...者、企业家出席本次活动。中欧国际工商学院运营管理学副教授梁超担任主持。中欧国际工商学院院长、管理学教授汪泓首先致欢迎辞,她指出,洛阳有着厚重的历史底蕴和蓬勃的现代化气息,以新
2024-04-12 21:11:00
全国高等院校计算机基础教育研究会数据科学专委会2023年学术年会成功召开
...名获得者、数据科学专委会秘书长、北方工业大学王若宾副教授,广西高校教学成果一等奖获得者、民族大学相思湖学院理工学院执行院长林国勇教授4位专家作专题报告,围绕“人工智能背景下大
2023-12-18 23:20:00
中国家电科技年会智能技术专题研讨会暨第九届智能家居创新发展大会圆满召开
...+灵感化”的智慧家电科技创新路径。山东大学的许宏吉副教授带来最前沿的情景和行为感知技术研究成果。在专题报告中,他从智能情景感知和人体行为感知两个方面对感知技术的新成果进行了分
2024-12-16 16:22:00
...升产品质量。”清华大学经济管理学院管理科学与工程系副教授林志杰表示。在山西某煤矿地面智能化集控中心,数十块液晶显示大屏幕上,井下中央变电所、架空人车道、无极绳绞车硐室、综采工
2024-03-17 10:24:00
武汉高仕达电气:创新驱动,引领能源互联网核心设备新纪元
...叶杰博士等一大批教授及博士硕士20余人,其中教授2人、副教授1人、博士6人、硕士10余人。此外,公司还荣获了武汉东湖新技术开发区管理委员会颁发的“中国光谷3551光谷人才计划
2024-10-14 17:12:00
更多关于科技的资讯:
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00
本报讯(记者雷嘉)围绕国产车规级芯片搭载应用,北京市科委、中关村管委会会同北京市智慧城市基础设施与智能网联汽车协同发展办公室
2025-09-05 11:08:00
河北新闻网讯(王丽英)“后厨不只是生产中心,更是服务体验的心脏。”“服务不仅仅是完成交易的过程,更是以关怀为主利他主义精神的体现
2025-09-05 11:08:00
海信冰箱五款产品通过中国家用电器研究院自动制冰性能认证
日前,经中国家用电器研究院严格检测与评估,海信冰箱旗下五款产品成功通过“电冰箱自动制冰性能认证”,并获颁认证证书。此次获证不仅是对海信冰箱自动制冰技术性能的肯定
2025-09-05 11:57:00
京东全球80+高校招聘 清华、剑桥等80校专场 现场面试拿offer!
9月5日,京东招聘公众号发文:全球80+高校!京东2026校园招聘进校行程发布。文中称:将在全球20+城市,80+院校
2025-09-05 12:10:00
花一万元植入DeepSeek,一场没有终点的流量游戏
文|邓咏仪编辑|苏建勋让你的产品在DeepSeek的答案里有一席之地,需要多少钱?答案是:数千甚至上万元。人在哪,流量就在哪
2025-09-05 14:56:00
爱尔眼科开启老视多学科诊疗新时代
9月4日,2025年屈光性白内障手术国际论坛(IRCS)暨第一届老视矫正MDT管理国际高峰论坛在杭州举办我国超八成60岁以上老年人正面临老视(老花眼)与白内障的“双重眼病困扰”
2025-09-05 15:18:00
获SIAL创新奖:诺啦格兰诺拉脆片让生活更美好  
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。吉丽莎(广州)贸易有限公司选送的产品诺啦格兰诺拉脆片跻身TOP10
2025-09-05 15:18:00
桃李面包广告语引争议“五仁不好吃是你还年轻”官方账号发文:领导拍的板,这个锅只能他来背
近日,桃李面包一则电梯广告文案引发争议。社交平台上流传的图片显示,桃李蛋月烧产品的广告语写道:“有人说五仁不好吃,我们认为
2025-09-05 15:29:00
京东超市布局产地直采 加大力度进口澳洲水果 助力澳洲水果深耕中国市场
今年开始,京东超市加大力度布局澳洲水果的供给和销售,投入资源帮助澳洲橙子、提子等水果进一步扩大销量。近日,在2025中国国际水果展上
2025-09-05 15:30:00
潍坊寿光市圣城街道一企业酿出康养“新食尚”
大众网记者 刘建永 潍坊报道为企赋能、助企发展是区域经济高质量发展的推动器。潍坊寿光市圣城街道在政策引领、优化营商环境
2025-09-05 15:50:00
大众网记者 王帅 通讯员 孙丽霞 杨阳 潍坊报道走进山东禾汇食品有限公司黄豆酱生产车间,一排排瓶装黄豆酱准备打包装箱,发往各大连锁商超
2025-09-05 15:50:00
9月4日,济南市委网信办联合山东省互联网传媒集团举办“‘科创泉城 智启未来’知名网络达人济南采风”活动。当日上午,10余位全国知名网络名人
2025-09-05 16:34:00