• 我的订阅
  • 科技

自主 AI 来了?一文详解火爆全网的 AutoGPT

类别:科技 发布时间:2023-05-03 11:00:00 来源:CSDN

最近,开源 AI 项目 AutoGPT 在开发者圈中掀起了不小的热潮,“无需人类插手,自主完成任务”的特点吸引来了很多人的关注,为此本文作者将就 AutoGPT 的工作原理进行深入解析。

原文链接:https://sudoapps.substack.com/p/technical-dive-into-autogpt

作者 | SAMIR KHOJA

译者 | 弯月 责编 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

你是否曾听说过开源项目 Auto-GPT?该项目使用各种技巧打造的 GPT 可以围绕某个特定的目标自主完成任务,还为 GPT 提供了一个可执行命令列表,帮助它朝着总体目标持续迈进。

我尝试使用 Auto-GPT 获得了一些有趣的结果,我还深入查看了项目的整体架构,GitHub 上 10 万+的 Star 数表明了其巨大的发展潜力。

为了更好地理解 Auto-GPT 的概念及其工作原理,我们将深入探讨以下核心领域:

▶ 该项目使用了哪些模型?

▶ 如何让 GPT 具备记忆力?

▶ 如何提高 GPT 的响应可靠性?

▶ 如何解析 GPT 的响应?

▶ 如何指定 GPT 可以执行 的命令?

自主 AI 来了?一文详解火爆全网的 AutoGPT

模型

在撰写本文之际,Auto-GPT 仅支持 OpenAI 的 GPT 模型。如果你不熟悉 OpenAI,请参考官方文档(参考链接:https://platform.openai.com/docs/guides/chat/introduction),了解 API 与模型的互动。

在使用 GPT-3.5-turbo 和 GPT-4 测试了 Auto-GPT 之后,我发现仍有改进的空间,但是通过 GPT-4 获得的输出远胜于 GPT-3.5-turbo。包括 token 限制在内的所有设置,都可以直接在 .env 文件中配置,例如可以利用 token 限制控制输入 (上下文)和输出(响应)的长度,从而控制成本。

我看到了一些与 LangChain 集成的拉取请求,这意味着Auto-GPT可以访问其他开源模型了,但也许项目本身也有集成其他模型的计划。我不打算在此深入研究 OpenAI API 或其他开源模型,但在接下来几个主题的讨论中,了解一些大型语言模型的背景会有所帮助。

如何让 GPT 具备记忆力?

GPT 模型的设计并没有考虑记忆力,然而 Auto-GPT 使用外部记忆模块消除了这个限制。在深入了解如何让 GPT 具备记忆力之前,我们先来介绍几个概念:

▶ 嵌入

▶ 向量存储与搜索

▶ OpenAI 的聊天补全 API

嵌入是文本的向量表示,可以更轻松地用于各种机器学习的模型或算法。Auto-GPT 使用了 OpenAI 的嵌入 API 根据 GPT 文本输出创建嵌入。

我们可以使用的向量存储服务有很多。Auto-GPT 使用的是:本地存储、Pinecone(第三方服务)、Redis 和 Milvus(开源服务)。Pinecone 和 Milvus 优化了向量搜索算法,可以根据相关上下文搜索文本嵌入。

Auto-GPT 将嵌入存储到这些向量存储服务之一,然后通过搜索当前任务会话的相关向量将上下文注入到 GPT。下面是这段代码的核心部分:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/chat.py

OpenAI 的聊天补全 API 拥有“系统”角色的概念,用于为 GPT 提供初始身份、约束和上下文。你可以看到在上述代码片段中,relevant_memory 被注入到对话中,作为 GPT 过去事件的引用。此外,Auto-GPT 还将相应角色完整的聊天对话传递给了聊天补全 API(最大长度为 token 的上限)。

给出提示以获得可靠的响应

在对话刚开始的时候,Auto-GPT 使用“系统”角色来配置约束,并进行自我绩效评估。Auto-GPT 有一个提示生成器,其中一些约束是硬编码的:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/prompt.py

我们看到在这些提示的引导下,GPT 的自主性和自力更生能力都得到了提高,还能看到很多通过持续反馈循环来帮助 GPT 自我改进输出的案例。我不确定下面的自我绩效评估提示是否能达到同样的效果,但至少这段代码奠定了基础:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/prompt.py

初始角色还有一些额外的提示。不过,需要指出的是:“每个命令都有成本,所以一定要确保智能且高效。我们的目标是以最少的步骤完成任务。”由于我们稍后会查看命令以及 GPT 执行每个命令的过程,因此这一行代码很重要,可以确保响应尽可能高效,避免不必要的步骤(使用更多 token),保证 最低成本。

解读响应

这可能是理解 Auto-GPT 内部工作原理最重要的方面。如果不能有效地解释响应,就不应该让 GPT 执行命令(即允许它访问外部世界)。Auto-GPT 使用了一种非常简单但很强大的提示技术来确保 GPT 以固定的 JSON 格式响应,然后通过代码进行解析:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

在测试中,我使用了固定格式的响应,从结果看来 GPT-3.5-turbo 非常高效,尽管偶尔也有一些幻觉(相比之下 GPT-4 更可靠)。我们通过这种方法指示 GPT 执行命令,还需要检查结果。在 GPT 执行命令时,响应的信息包含在 command 对象中。

与现实世界互动

自主代理要想真正发挥作用就必须能够完成实际的工作,并与现实世界交互,比如文件系统或互联网等。Auto-GPT 必须编写能授权 GPT 执行的每个命令,在生成约束和自我评估的初始提示时,还可以提供可执行命令及其参数的列表。下面是将命令添加到提示符的类函数:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

基本的提示生成器中有一个预定义的命令列表:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/stable/autogpt/prompt.py

这是 GPT 引用命令的格式,可以使用参数执行命令。以下代码可以将最终提示格式化为 GPT 的字符串:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

如你所见,这段代码集合了上述所有功能。这个提示可以为 GPT 提供约束条件、自我评估的方向、资源、命令以及响应格式。接下来,在解析 GPT 返回的响应时,我们就很清楚它所执行的命令和参数了。最后一步是执行命令:

自主 AI 来了?一文详解火爆全网的 AutoGPT

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/stable/autogpt/app.py

在这段代码中,在解析 GPT 的响应后,每个命令都获得了自己的参数,然后执行。GPT 的命令之一是 task_completed,如果在连续模式下运行,程序将在 GPT 实现目标后关闭或退出:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/app.py

BabyAGI

BabyAGI 也使用了类似的概念,但大大简化了实现(整体功能较少)。它支持 LLaMA 和 OpenAI 作为模型输入,在提供目标和初始任务后,创建三个代理来执行目标:任务执行代理、任务创建代理和任务优先级代理。每个代理都有自己的提示和约束,包括来自每个相关任务执行的上下文。这个过程将循环执行,直到没有剩余的任务并且目标完成。

Auto-GPT 和 BabyAGI 都获得了大量关注,并且正在不断改进。

总结

毋庸置疑,很多人为这些项目做出了努力,并在不断改进它们。这些项目是 AI 领域向前迈出的激动人心的一步,我们距离 AI 自主完成任务并在生活方方面面协助我们的未来更近了一步。我要强调的不仅仅是一些核心概念,这些概念可以帮助我们了解其内部运作方式,并为自主代理的新世界做出贡献。

▶用 GPT-4 在黑客大赛上“炸场”:不完全会 Linux、Perl,似乎也没有关系了!

▶ “两周时间,我体验了 GPT-4 从编程‘神器’变成编程‘智障’!”

▶ HarmonyOS 最热门、生态成“老大难”,揭晓数万名开发者眼中的国产操作系统! 返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-03 11:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!
...会KubeCon China 2023详细议程公布!▶ 室温超导真要来了?一文读懂来龙去脉粉丝福利:返回搜狐,查看更多责任编辑:
2023-08-03 18:00:00
谷歌Gemini大模型的“先进”表现如何?一文告诉你
2023-12-09 14:41:06 作者:姚立伟谷歌最近发布的大语言模型Gemini引起了很多关注。然而,据谷歌发言人透露
2023-12-09 17:02:00
2023“评评无奇”:一文回顾上游评论年度爆款
“鼠头鸭脖”“饭圈文化”“北极鲶鱼”“鹅腿阿姨”“直播流量”“网红打卡”……每一个热点背后,都有一个因热度、关注而极速转动的命运齿轮。“命运的齿轮为何转动”是大众对充满不确定性的
2023-12-30 08:27:00
李彦宏:没有应用,基础模型将一文不值
...应用才是当前更具价值的话题,“没有应用,基础模型将一文不值”。百度创始人李彦宏在2024世界人工智能大会演讲。今年3月以来的开源闭源争议中,李彦宏称“有些外行甚至混淆了模型开
2024-07-04 17:33:00
共享wifi项目火爆全网!共享wifi贴为何如此受欢迎?
...选项目。那么,为什么共享wifi贴一经问世就火爆全网?一文说明白。共享wifi贴是由共享wifi创始人V火项目经理研发的
2023-06-28 11:56:00
刀郎新歌《罗刹海市》火爆全网 “ChatGPT”都看出了其中的嘲讽
...包括我在内的吃瓜群众,在网上引发热议,歌曲也是火爆全网。有些网友认为“刀郎是在回应之前吐槽他歌土、没内涵的人,你不是要内涵吗?这次给你足够的内涵”,也有些人认为“刀郎是在讥讽
2023-07-25 15:02:00
别被火爆全网的ChatGPT“骗了”
...故事情节和结局。ChatGPT根据命题撰写小说框架。/ 深燃截图一次没有写完,经过提醒后,还能在“调...
2022-12-10 12:56
孙悟空骑摩托车,《甄嬛传》变枪战片……这类短视频最近火爆全网,一打开就停不下来?
上一秒还在宫斗的《甄嬛传》,下一秒突然变成了枪战片。前一回还在取经的孙悟空,后一回却骑上了摩托车。近来,经典国产电视剧被AI魔改的短视频风靡网络,引发网友争议。AI魔改有多魔幻?
2024-12-10 10:40:00
ChatGPT等大模型的火爆带火了“提示词工程师”这个新职业。有人将“提示词工程师”称为“会咒语的那群人”。据了解,目前国内各大招聘平台上名为“Prompt工程师”或“PromptEngineer”的职位月薪大多在1
2023-08-22 10:28:00
更多关于科技的资讯:
双胞胎在子宫内斗争出生后一红一白:死亡率极高 医生抢救后转危为安
4月1日消息,据媒体报道,在湖南某医院内,一对双胞胎宝宝肤色异常,一红一白对比明显,体重相差较大。两个宝宝的症状让医生意识到
2025-04-01 22:10:00
直曲之争就此终结!越来越多厂商青睐直屏
快科技4月1日消息,直屏好还是曲屏好?机圈网友为此吵翻了天,如今来看,直屏曲屏之争划上了一个句号,曲面屏即将淡出历史舞台
2025-04-01 22:10:00
江南时报讯 近日,在人民银行宿迁市分行的悉心指导与大力支持下,泗阳农商银行自主建设的发行基金托管系统正式上线,并进入试运行阶段
2025-04-01 22:14:00
长沙人可以带猫狗坐飞机了:湖南航空推出“爱宠同行”产品
4月1日消息,据媒体报道,为了满足爱宠人士出行需求,湖南航空推出“爱宠同行”产品,自4月1日起,从长沙出发的旅客,可携带自己的爱宠一同开启空中之旅
2025-04-01 22:40:00
苹果终于听劝!妙控鼠标“反人类”的充电设计迎来大升级
到目前为止,有关妙控鼠标(Magic Mouse)3代的两个主要传言包括重新定位的充电接口以及更符合人体工程学的外形设计
2025-04-01 23:10:00
任天堂Switch2直面会前夕 来看看目前我们知道的一切
在Nintendo Switch2 直面会即将到来之际,IGN 官方发布了一篇文章,总结了目前关于这款备受期待的新主机我们所了解的一切
2025-04-01 23:40:00
比黄金涨的还猛!羽毛球价格上涨100% 网友纷纷提前囤货
快科技4月1日消息,近两年,众所周知,黄金价格真是一路狂飙。今日上午10点25分,黄金涨至3139.92美元的新纪录高位
2025-04-01 19:09:00
本文转自:人民网人民网北京4月1日电 (记者夏晓伦)当下,消费市场的竞争日益激烈,餐饮行业也在不断探寻新的发展路径与价值增长点
2025-04-01 19:16:00
全自研高性能RISC-V服务器芯片在前海首发
本文转自:人民网睿思芯科创始人、CEO谭章熹正式发布灵羽处理器。主办方供图人民网深圳4月1日电 (刘森君)3月31日,深圳前海企业睿思芯科举办2025春季新品发布会
2025-04-01 19:35:00
比亚迪腾势赵长江:Z9GT 120km/h追尾大货车 电池完好无损没有起火自燃
快科技4月1日消息,车辆碰撞后电池起火事件频发,再次引发大家对于新能源车安全的关注。今日,腾势销售事业部总经理赵长江微博发文称
2025-04-01 19:40:00
比亚迪腾势汽车3月销量达12620辆:平均成交价36.5万元
快科技4月1日消息,2025年4月1日,腾势汽车发布最新销量数据。3月,腾势汽车累计销量达12620辆,同比增长22.8%
2025-04-01 19:40:00
SU7爆燃致3人死亡:小米汽车遭遇最严峻的信任危机
经历了一整晚的微信聊天记录发酵之后,小米SU7在安徽高速上智驾发生车祸,导致三名花季少女丧生的命案,登上了热榜的头条。巨大的舆论风波背后
2025-04-01 19:40:00
女子冒风烧纸祈福引燃9辆车 官方通报:刑拘
快科技4月1日消息,清明将至,又到了祭祖祈福的时候,尤其需要提醒大家注意用火安全。据“北京朝阳消防”最新通报,3月30日
2025-04-01 19:40:00
10年来最大改版iOS 19六月登场!3款iPhone遭淘汰无缘升级
快科技4月1日消息,苹果将于6月10日举办WWDC开发者大会,届时将公开新一代iOS 19操作系统,有消息称这将是近十年来iOS系统最大幅度的改版
2025-04-01 19:40:00
连续53年吃35000个汉堡!美国72岁奇男子创纪录:非常健康
这绝对是一个不良的示范,但美国男子唐纳德·戈斯克(DonaldGorske)是个幸运儿!他是麦叔叔家巨无霸的“终极粉丝”
2025-04-01 19:40:00