• 我的订阅
  • 科技

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

类别:科技 发布时间:2024-10-11 12:03:00 来源:机器之心Pro

单智能体更简单、更易于维护。

最近,「多智能体系统」是人工智能领域最热门的流行词之一,也是开源框架 MetaGPT 、 Autogen 等研究的焦点。

但是,多智能体系统就一定是完美的吗

近日,来自卡内基梅隆大学的副教授 Graham Neubig 在文章《Don't Sleep on Single-agent Systems》中强调了单智能体系统也不可忽视。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

GrahamNeubig 从以下几个方面展开:

当代 AI 智能体发展的元素,包括大语言模型、提示以及动作空间; 多智能体系统示例; 多智能体系统存在的问题; 如何从使用多个专门的智能体过渡到一个强大的智能体,以及一些需要解决的问题。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

CMU机器学习和计算机系助理教授陈天奇对这项研究进行了转发并评论:「这是一篇关于如何让单智能体系统更强大的深刻见解,对机器学习系统也有很好的启示。提示前缀缓存将成为与其他一般推理优化技术相互作用的一项关键技术」。

CMU副教授:在多智能体流行的当下,不要忽视单智能体系统

基于 LLM 的智能体

大多数智能体都是基于大语言模型构建的,如 Anthropic 的 Claude 或 OpenAI 的语言模型。但语言模型不足以构建一个出色的智能体,构建一个智能体至少需要三个组件:

大语言模型LLM; 提示:可以是用于指定模型一般行为的系统提示,或者从智能体周围环境中提取的信息类型; 动作空间:上述两项是研究者提供给 LLM 的辅助工具,以便智能体在真实世界中产生动作。

一般来说,当涉及多智能体系统时,至少要改变这三个组成部分中的其中一个。

多智能体示例

假设你正在构建一名 AI 软件开发助手,这里作者以 CodeR 为例,这是一个用于 AI 软件开发的多智能体框架。它包括多个智能体,所有智能体都使用相同的底层 LM,但提示和动作空间各不相同:

管理器(Manager):该智能体的提示指定它应该为其他智能体编写一个规划来执行,以及输出规划的动作空间; 复现器(reproducer):该智能体有一个提示,告诉它重现该问题,以及一个将代码写入重现错误文件 reduce.py 的动作空间; 故障定位器(Fault Localizer):该智能体有一个提示,告诉它找到导致错误的文件,以及一个使用软件工程工具进行故障定位和列出文件以供以后使用的动作空间; 编辑器(Editor):该智能体有一个提示,用于接收复现器和故障定位器的结果,并有一个动作空间,允许它对文件进行编辑; 验证器(Verifier):此智能体具有提示,可接收其他智能体的结果,以及输出问题是否已解决的动作空间。

这是构建一个系统时所需要的结构,但是在构建这样的系统时存在一些困难。

多智能体系统存在的一些问题

在构建多智能体系统时,你可能会遇到许多问题,比如:

获得正确的结构:多智能体系统通过添加结构来解决问题。当智能体面临的问题与指定的结构完全匹配时,效果会很好,但问题是如果不匹配怎么办?

上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递给其他智能体,则通常会导致重要的上下文信息丢失,而这些信息可能对下游智能体有用。

可维护性:最后,这些智能体通常都有自己独立的代码库,或者至少有独立的提示。因此,多智能体系统可能拥有更大、更复杂的代码库。

有趣的是,很多这些挑战也适用于人类组织!我们都有过这样的经历:团队组织混乱,沟通不畅,或者当某个成员离开时,无法维持必要的技能。

如何打造出色的单智能体系统

人们为什么要打造多智能体系统?一个需要说明的重要原因是:专用于特定任务的智能体的表现通常很好,只要有合适的结构和工具,它们就能很好地完成相应的任务。

单智能体有能力竞争吗?

可能比我们预想的还更容易一些,作者表示这里已经有一个很好的原型:https://github.com/All-Hands-AI/OpenHands/tree/main/agenthub/codeact_agent

下面我们就来看看,要打造出优秀的单 LLM、单动作空间和单提示工程技术,需要些什么。

单 LLM:这是相对比较容易的部分。近段时间已经出现了一些表现出色的通用 LLM,包括 Claude 和 GPT-4o 等闭源模型以及 Llama 和 Qwen 等开源模型。虽说这些模型也不是万能的,但它们也确实能完成多种多样的任务。就算它们缺乏某个功能,也可以通过持续训练来增添,同时不会对其它功能产生太大影响。

单动作空间:这也不难。如果我们有多个使用不同工具的智能体,那么我们可以 (1) 为模型提供相对通用的工具,以帮助它们解决问题;(2) 如果不同的智能体有不同的工具组合,则可以将他们连接起来。比如,在 OpenHands 中,可以向智能体提供写代码、运行代码和执行网络浏览的工具。这样的通用方法可让模型使用为人类开发者开发的软件工具,从而增多它们的功能,做到其它多智能体能做到的事。

单提示工程技术:这是比较困难的地方!我们需要确保智能体在如何解决任务上获得正确的指示,同时从其环境中获得正确的信息。

下面给出了两个选择:

将所有提示词连接起来使用:如果我们有一个多智能体系统,要使用 10 个不同的提示词,那么为什么不将它们连接组合到一起呢?近期的长下文模型已经有能力处理多达几十万 token 了,比如 Cluade 能处理 20 万 token,而 Llama 是 12.8 万。OpenHands 也使用了此方法。但这种方法也有一些缺点。首先是成本,更长的提示词需要更多金钱和时间,不过现在有一些技术(比如 Anthropic 的提示词缓存技术)可以降低其成本。这种方法的另一个缺点是,如果提示词太多,则 LLM 可能无法关注到重点,但随着模型能力提升,LLM 在确定长上下文中的重要信息方面越来越强了。 检索增强式提示:另一种可能的选择是使用检索。如同检索增强式生成(RAG)系统一样,可以出于效率或准确度的目的对长上下文进行裁剪。在选择提供 LLM 的示例方面,这里有一些研究进展:https://arxiv.org/abs/2209.11755

总结

本文并不是说多智能体就没有用武之地了。比如在一个智能体可以访问专有信息,而另一个智能体则代表了另一个人的情况下,多智能体系统肯定大有作为!

本文的目的是批判性地思考让系统更加复杂这一趋势。有时候简单就是最好的 —— 有强大的模型、强大的工具和多种多样的提示词就足够了。

参考链接:https://www.all-hands.dev/blog/dont-sleep-on-single-agent-systems

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-11 14:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“法管家”上线,租房合同风险秒变“纸老虎”!
...标注到模型训练的全链条服务体系。”团队核心成员林川副教授说。“法管家”法律大模型的训练师们正在对大模型进行“喂养”训练该科技成果从“云端”到“身边”,是校企合作推动科技创新和
2025-03-15 12:26:00
数智化时代 AI 赋能计算机教育研讨会在桂林成功举办 助力广西教育现代化新征程
...打造虚实结合、软硬协同的教学新模式。苏州大学王红玲副教授则以课程为例,提出“痛点诊断-方案创新-实践验证”的智能化教学全流程重构方案。通识教育与产业赋能:湖南大学罗娟教授聚焦
2025-06-12 11:14:00
第三届中国汽研汽车指数年会召开,多项重磅成果权威发布
...国汽研信息智能事业部首席专家朱西产、中南大学交通院副教授、高速列车研究中心副主任伍钒、吉林大学唐敖庆领军教授许楠分别作《IEEE ITSS标准:系统验证与确认》《组合驾驶辅助
2025-07-12 20:19:00
AI赋能教育,英才这场盛会开启教学新篇章!
...究中心主任高天雷副研究员,济南大学硕士生导师丁广乾副教授,山东协和学院计算机科学教研室主任王红副教授,华为济南创新中心华为云高级解决方案架构师韩永,华清远见教育集团济南分公司
2025-03-31 18:44:00
智能制造如何起飞?第九届中欧思创会洛阳站举办
...者、企业家出席本次活动。中欧国际工商学院运营管理学副教授梁超担任主持。中欧国际工商学院院长、管理学教授汪泓首先致欢迎辞,她指出,洛阳有着厚重的历史底蕴和蓬勃的现代化气息,以新
2024-04-12 21:11:00
全国高等院校计算机基础教育研究会数据科学专委会2023年学术年会成功召开
...名获得者、数据科学专委会秘书长、北方工业大学王若宾副教授,广西高校教学成果一等奖获得者、民族大学相思湖学院理工学院执行院长林国勇教授4位专家作专题报告,围绕“人工智能背景下大
2023-12-18 23:20:00
中国家电科技年会智能技术专题研讨会暨第九届智能家居创新发展大会圆满召开
...+灵感化”的智慧家电科技创新路径。山东大学的许宏吉副教授带来最前沿的情景和行为感知技术研究成果。在专题报告中,他从智能情景感知和人体行为感知两个方面对感知技术的新成果进行了分
2024-12-16 16:22:00
...升产品质量。”清华大学经济管理学院管理科学与工程系副教授林志杰表示。在山西某煤矿地面智能化集控中心,数十块液晶显示大屏幕上,井下中央变电所、架空人车道、无极绳绞车硐室、综采工
2024-03-17 10:24:00
工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安全防御白皮书(2025)》
...研究人员和技术开发者关注。清华大学深圳国际研究生院副教授张盛表示,“白皮书是一部兼具学术严谨性与实践指导性的里程碑式报告,构建了一个涵盖技术、监管、标准、生态与人才的综合治理
2025-10-30 12:08:00
更多关于科技的资讯:
人工智能如何赋能“安徽万物”?
大皖新闻讯 1月16日,《安徽省“人工智能+万物”应用行动方案》发布,到2030年,安徽“人工智能+万物”应用落地将超万个
2026-01-17 21:56:00
鲁网1月17日讯1月13日上午,普惠(临沂)投资服务有限公司考察组一行赴临沂市供应链金融协会开展学习交流活动。临沂市供应链金融协会会长
2026-01-17 14:47:00
1月16日,全球最大、起重量达2300吨的桥面吊机在河北省秦皇岛市一装备制造企业正式下线,标志着我国在大型桥梁施工装备领域又获重大突破
2026-01-17 15:44:00
2026天然苏打水市场趋势:健康化、场景化成主流 泉匠深耕多区域市场实现销量突破
随着健康消费理念的深度渗透,天然苏打水行业正迎来高质量发展的黄金期。据行业权威报告预测,2026年中国天然苏打水市场规模将突破260亿元
2026-01-17 15:58:00
开元云与广西大学人工智能学院达成战略合作,共建AI产教融合新高地
广西大学人工智能学院常务副院长张振荣、副院长赵志刚、陈燕教授等老师,出席双方产学研合作签约仪式。2026年1月15日 广西南宁
2026-01-17 15:58:00
数据接口安全风险监测国标正式发布!深信服深度参编
根据2025年12月2日国家市场监督管理总局、国家标准化管理委员会发布的中华人民共和国国家标准公告(2025年第33号)
2026-01-17 16:00:00
近日,国网潢川县供电公司依托用电信息采集系统及“专变负载可视化”数据集,构建反向有功异常自动监测告警机制,实现非光伏用户反向用电异常精准识别处置
2026-01-17 16:00:00
新消费|万物皆可租!这届年轻人为何“能租就不买”?
租一台口袋相机只需30元一天专业优质的画质却可以让旅途回忆更生动用百来元就能配齐一整套露营装备花100元便能轻松满足整趟出国旅行的穿搭需要……如今越来越多的年轻人正通过“租赁”重新定义自己的消费方式近日
2026-01-17 16:54:00
冷暖省电双先锋!美的酷省电二代横扫抖音商城三榜冠军
2026刚开年,空调行业首款爆品已然出现——全新上市美的酷省电二代便凭硬核实力脱颖而出,强势斩获抖音商城智能空调爆款榜
2026-01-17 16:00:00
厦门钨业通过技术创新与人才创新,不断攻克行业技术难题,塑造发展新动能让“有色”更出色东南网1月17日讯 (福建日报记者 戴敏 李向娟)近日
2026-01-17 11:38:00
在漳州龙文区,智能机器人等一批前沿项目正在聚集,新质生产力蓬勃生长——“未来场景”来到家门口东南网1月17日讯 (福建日报报业集团记者 杨凌怡 通讯员 张小惠)广场前
2026-01-17 11:41:00
中国姚绣站上巴黎大展C位
1月15日至19日,非遗苏绣品牌姚绣(Yao Silk)再度亮相巴黎M&O展,成为本届展会Fine Craft(精品工艺)展区唯一中国品牌
2026-01-17 09:40:00
民大学子全国“摘金” AI巧解垃圾分类与楼宇管理难题
荆楚网(湖北日报网)讯(记者林杉 许文秀 通讯员陈韶月 张祎晗)面对垃圾分类的效率瓶颈,人工智能与机械设计如何给出更优解
2026-01-17 10:36:00
长白时评评论员 久泰平近日多起滥用“七天无理由退货”的新闻引发社会关注。有商家曝光,有学生集体网购演出服,演出后再把带着污渍
2026-01-17 05:55:00
1月14日消息,工业和信息化部近日公布了2025年全国中小企业人工智能典型应用场景名单,晋西春雷自主研发的“AI视觉质检实现铜带缺陷精准识别”项目成功入选
2026-01-17 07:39:00