• 我的订阅
  • 科技

OpenAI:搞 Agent 时,你要注意这些

类别:科技 发布时间:2024-04-29 14:00:00 来源:人人都是产品经理

这两天参加了 OpenAI 的一些活动。有一部分是讨论 Agent/智能体系统在落地时,遇到的各种问题,以及一些可行的实践。这里我带来了一些笔记。

基于下面的这篇论文,地址是:

https://openai.com/research/practices-for-governing-agentic-ai-systems

OpenAI:搞 Agent 时,你要注意这些

01 关于 Agent

Agent 是一种 AI 的应用方式,但随着语境的迁移,它慢慢从「AI 应用」里剥离了出来。不准确来说,这里的感觉,就像是 H5 从 html5 中剥离了出来。

按当前的语境,我们会把 ChatGPT 就是看成一种 AI 应用,它能理解你的问题并给出回答。而会把 GPTs 这种订制后的、能调用外部功能的、能够自己处理复杂任务的产品,叫做 Agent。

Agent 和 AI应用(如ChatGPT)之间的区别和联系主要体现在“代理性”(agenticness)这的程度上。如果一个AI系统,能够在没有直接人类监督的情况下运作,其自主性越高,我们称之为代理性越强。这是一个连续体,不是非黑即白的判断,而是根据它在特定环境中的表现来评估其代理性的程度。

在这种定义下,正统 Agent 不仅能回答问题,还能自己决定做什么,它能够通过生成文本来“思考”,然后做出一些操作,甚至能创造出更多的 AI 帮手来帮帮忙,就比如下面这个图。

OpenAI:搞 Agent 时,你要注意这些

但我们发现,尽管 Agent 看起来很美好,但在实际落地的场景中,也是困难重重,风险多多,出现了问题,责任划分也很麻烦。比如这里:如果我希望让某个 Agent 帮我微信收款,但它给别人展示的是付款码,那么这里谁背锅?

也是因为这些问题,就有了本次的话题:「从实践的角度出发,落地 Agent 有哪些注意点」。共包含 7 个主要点:执行效果评估、危险行为界定、默认行为确定、推理透明展示、Agent 行为监控、Agent 作恶追责、危险事故叫停。

02 Agent 落地难点

由于会上的 PPT 不便分享,我便在自己吸收后,重新制作了一份 PPT,安心食用

1. 执行效果评估

OpenAI:搞 Agent 时,你要注意这些

在商业环境中,确保任何工具的可靠性是基本要求。

然而,AI Agent 的复杂性在于其工作场景和任务的不确定性。例如,一个在模拟环境中表现优异的自动驾驶车辆,可能因现实世界中不可预测的变量(如天气变化和道路条件)而表现不稳定。

我们尚缺乏有效的方法,来准确评估 AI Agent 在实际环境中的性能。

2. 危险行为界定

OpenAI:搞 Agent 时,你要注意这些

AI Agent 在执行高风险操作之前需要获得用户的明确批准。例如,在金融领域,AI 执行大额转账前必须得到用户同意。

但需要注意,频繁的审批请求可能导致用户出现审批疲劳,从而可能无视风险盲目批准操作,这既削弱了批准机制的效果,也可能增加操作风险。

3. 默认行为确定

OpenAI:搞 Agent 时,你要注意这些

当 AI Agent 遇到执行错误或不确定的情形时,是要有一个默认行为的。例如,如果一个客服机器人在不确定用户需求时,其默认行为是请求更多信息以避免错误操作。

然而,频繁的请求可能会影响用户体验,因此在保障系统安全性与保持用户体验之间需要找到平衡。

4. 推理透明展示

OpenAI:搞 Agent 时,你要注意这些

为了保证 AI Agent 决策的透明性,系统需要向用户清晰展示其推理过程。举例来说,一个健康咨询机器人应详细解释其提出特定医疗建议的逻辑。

但如果推理过程太复杂,普通用户可能难以理解,这就需要在确保透明性和易理解性之间找到平衡。

5. Agent 行为监控

OpenAI:搞 Agent 时,你要注意这些

假设一个 AI 系统用于监控仓库库存,如果监控系统误报,误认为某项商品缺货,进而不断的进货,那么可能导致库存的严重积压,并造成极大损失。

于是,我们思考:是否需要另一个 Agent 来监控这个 Agent?成本账怎么算?

6. Agent 作恶追责

OpenAI:搞 Agent 时,你要注意这些

考虑一个匿名发布内容的 AI Agent,如果其发布了违规内容,要追踪到具体负责的人或机构可能极其困难。这种情况下,建立一个能够确保责任可追溯的系统尤为关键,同时还需要平衡隐私保护和责任追究的需求。

7. 严重事故叫停

想象一个用于自动化工厂管理的 AI Agent,在系统检测到严重故障需要立即停机时,不仅需要停止主控系统,还要同步关闭所有从属设备和流程。如何设计一个能够迅速且全面响应的紧急停止机制,以防止故障扩散或造成更大损失,是一项技术和策略上的复杂挑战。

最后,本次就这些。

本文由人人都是产品经理作者【赛博禅心】,微信公众号:【赛博禅心】,原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-29 15:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...”,它能与用户进行个性化沟通,结合发帖、互动等多项行为对用户进行个性化主动关。目前,“AI苟蛋”具备拟人、知识、多模态、时间感知等方面的融合能力,能够对图片、文本轻松回复,也
2023-12-11 14:38:00
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...取:LLMs 通过其常识和语言理解能力,能够从用户反馈或行为历史中推断出硬性约束、效用函数或个性化需求。然而,如何处理多目标环境下的偏好冲突(如成本与效率的平衡)仍需进一步探
2024-09-27 13:42:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...推理为安全和对齐提供了新的思路。OpenAI 发现,将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观和原则。通过向模型教导自己的安全规则以及如何在上下文
2024-09-13 16:42:00
“专家系统”:人工智能辅助战场决策
...统一般都是“人-机”交互式系统。通过人机接口界面,用户用对话的方式进行询问,机器根据用户提供的事实,运用掌握的知识展开推理,从而给出问题答案。值得一提的是,专家系统不仅能给出
2023-02-10 04:05:00
ChatGPT 到底是赛博做题家还是科研颠覆者?
...,并发现了复杂类型的错误。例如,在回答有关电子量子行为的问题时,GPT-3.5给出了正确的答案,但至少在最初错误地给出了答案来源的物理方程。当问题重复时,GPT-3.5能够正
2023-04-19 23:22:00
DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新
...慢SQL诊断、发现以及索引优化等;其二是安全,提供异常行为检测、敏感数据发现;其三是运维,即整个系统的运维诊断,包括参数调优、系统分析诊断等。最顶层是监控,通过端到端的监控诊
2023-04-25 13:00:00
在杭州,我们看到了阿里AI生态的近百种应用 | 焦点分析
...占卜和心理咨询。还有人用模型训练了能够模仿真实宠物行为的AI猫咪,解决无法养宠人群的情感陪伴需求的同时,还能为现实动物打造虚拟IP
2023-11-04 13:47:00
一款赛博朋克风的侦探推理解谜游戏
...导的“黑镜”风格世界和美式犯罪故事情节。本作是一款赛博朋克风的侦探推理解谜游戏,游戏中玩家要扮演一名黑客兼私家侦探,要在未来利用网络、黑客技术以及无人机,做到人在家中也能侦查
2023-03-12 14:02:00
模型即服务,卓世科技MaaS平台 2.0 正式上线
...槛:通过拖拽的方式,完成训练流程的搭建,极大简化了用户操作,大幅降低模型开发的技术门槛 4、快捷的数据接入与知识增强:特色的数据接入体系以及知识增强能力,帮助企业快速接入各
2024-08-07 09:45:00
更多关于科技的资讯:
聚焦雄安新区丨“人工智能+”开拓产业发展新赛道
“人工智能+”开拓产业发展新赛道——2026年雄安新区“人工智能+”创新生态系列活动观察人工智能,是雄安新区大力发展的主导产业之一
2026-02-12 08:47:00
在多个短视频平台和电商平台上,不少账号公开发布视频,称可以绕开一些平台的人脸识别验证。这些视频中,有人遮挡住手机摄像头
2026-02-12 08:58:00
当前,健康中国战略深入实施,智能健身市场需求激增,舒华体育深化"AI运动科技"定位,推动奥运技术全面渗透至各类场景,让大众共享科学健身成果
2026-02-12 09:28:00
以旧换新激活潍坊消费新引擎:一场政策引领的绿色消费革命
鲁网2月11日讯(记者 王玉龙)2025年,潍坊市消费品以旧换新直接拉动消费160亿元,是2024年的4.2倍;129万人次享受到20
2026-02-12 09:56:00
“西湖纹样”小程序正式上线杭州日报讯 第十九届杭州文博会上,西湖区的展馆前天天大排长龙。纹样编织袋、纹样透卡、纹样茶点礼盒
2026-02-12 06:41:00
2月6日,上海超导科技股份有限公司向太原钢铁(集团)有限公司发出一封感谢信,披露太钢与该企业一场历时五年的联合攻坚结出的硕果
2026-02-12 07:31:00
李建南摘要:随着大模型在预测、生成与复杂模式识别中的广泛应用,统计建模范式正在经历深刻转变。相较于以概率假设与参数推断为核心的传统统计模型
2026-02-12 07:32:00
以科技自立自强构筑创新高地杭州日报讯 近日,在湖州莫干山高新区,灵心巧手(Linkerbot)年产3万套具身智能机器人灵巧手的超级工厂项目正在全速推进
2026-02-12 07:11:00
中新经纬2月11日电 据国家市场监督管理总局网站消息,2月4日,国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)
2026-02-11 20:18:00
季季有主题,周周有优惠!2026年河北省电影惠民观影促消费活动启动
河北日报客户端讯(记者肖煜)为积极响应落实国家电影局全国电影惠民消费季安排,进一步激活河北电影市场消费潜力,丰富群众文化生活
2026-02-11 22:05:00
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00
厦门城市可信数据空间开放试运行推出“马上有数”进驻激励计划 首发5个月资源免费共享东南网2月11日讯 (海峡导报记者 康泽辉) 近日
2026-02-11 17:50:00
元梦空间荣膺两项大奖 闪耀2025人工智能未来设计大赛
2025年11月10日,由工业和信息化部工业文化发展中心主办的2025“人工智能未来设计大赛”全国总决赛在山西太原圆满落幕
2026-02-11 17:50:00