• 我的订阅
  • 科技

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

类别:科技 发布时间:2024-12-05 09:43:00 来源:机器之心Pro

近几年在生成式 AI 技术和商业创新飞速发展的背景下,创建高质量且低成本的生成式 AI 应用在业界仍有相当难度,主要原因在于缺乏系统化的调试和优化方法。

近日,UCSD 张怡颖教授的 GenseeAI 团队推出了首款可自动提升 AI 工作流生成质量并降低生成成本的工具 Cognify。Cognify 可以自动优化 AI 工作流,支持 LangChain、DSPy、Python 等语言框架。Cognify 的核心思路是一种创新的分层工作流级优化方法。Cognify 可将生成式 AI 应用的生成质量提高多达 48%,并将执行成本降低多达 90%。Cognify 现已开源。

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

开源地址:https://github.com/GenseeAI/cognify

生成式 AI 工作流

当前的生成式 AI 产品通常都是以生成式 AI 工作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。

与单次调用 AI 模型相比,AI 工作流提供了更强大、可定制和集成化的解决方案。当前业界的 AI 工作流通常由工程师编写。在部署之前,工程师需要手动调整 AI 工作流的结构和提示词(prompt),并为工作流中的各个步骤选择合适的模型。

然而,由于缺乏系统化的调优方法,AI 工作流的部署经常非常耗时,已部署的工作流也可能面临质量不佳、不稳定或成本太高等问题。虽然有许多生成式 AI 工作流的开发框架,比如 Coze,Dify,LangChain,DSPy 和 Claude MCP,但是并没有可以帮助开发者系统调试和优化工具。

Cognify 优化器

Cognify 是一款全面、多目标的开源 AI 工作流优化器。Cognify 的优化过程基于自动选择 AI 模型、改进工作流结构和增强提示词。Cognify 实现了工作流的多目标优化,包括提高生成质量和低生成成本。

对于不同的应用场景,Cognify 都用相同或更小的模型达到了更高的生成质量,推动了质量 - 成本 Pareto 边界,并且允许用户选择不同的质量 - 成本组合(结果如下图所示)。在此过程中,Cognify 的优化实现了「一键」全自动化。

同时,Cognify 也允许用户自定义优化方法 Cogs(Cognify 把各种优化统称 Cog),备选模型种类,以及最多优化次数。Cognify 目前支持 LangChain、LangGraph、DSPy 和基于 Python 开发的工作流。

Cognify 核心技术

全局级别的工作流超参数调优

Cognify 的核心理念是对整个工作流进行优化,而不是在每个单独的工作流组件中进行优化。由于上游组件的生成结果对下游组件的性能有重大影响,孤立的优化各个组件可能导致最终生成质量不佳,而且整体运行成本增加。

Cognify 通过实验各种 Cog 组合,并通过最终生成的质量评估这些组合的效果,从而优化整个工作流。

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

在整体工作流优化中,一个关键挑战是优化成本,包括模型运行成本和耗时。一个简单的做法是对每个可能的 cog 组合进行网格搜索,但这会导致指数级增长的优化成本。为了解决这个问题,Cognify 采用了两种策略。

首先,Cognify 将工作流视为一个优化对象,并将所有可能的 Cog 视为其超参数 (hyperparameter)。Cognify 为工作流超参数设计了一套新的贝叶斯优化器(Bayesian Optimizer),用于调优这些工作流超参数。特制的优化器能够有效探索 cog 组合空间。其次,Cognify 将 cog 分为两层:外循环包含更改工作流结构的 cog(例如添加或移除组件或重新排列它们的顺序),内循环包含不影响工作流结构的 cog(例如提示词调优和模型选择)。这种双层方法减少了贝叶斯优化器需要探索的整体搜索空间。

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

CogHub:AI 工作流优化器集合

与 Cognify 同时推出的是CogHub——一个开源 cog 集合。就像 HuggingFace 集合了开源的模型,CogHub 集合了开源的 AI 工作流优化方法。CogHub 在被 Cognify 内部调用的同时也面向程序员或未来的生成式 AI 工具。

CogHub 现支持以下五种 cogs:

任务分解 (Task Decomposition)(外循环):将一个任务(一次 LLM 调用)分解为多个细分的子任务(多次 LLM 调用)。 任务集成 (Task Ensemble)(外循环):构建并结合多个模块来完成任务。 多步推理 (Multi-step Reasoning)(内循环):要求 LLM 逐步推理。 少样本学习 (Few-shot Learning)(内循环):从输入样本中添加一些高质量的示例演示。 模型选择 (Model SelectioN)(内循环):评估不同的模型。

优化案例

以下是一个数据可视化任务的例子。任务目标是由手机销售数据生成针对每个厂商每个季度的销量的箱型图,并计算每个手机商的销售平均值,最终用平均值线表示。

下图展示了几个生成图的对比, 1) 人工画的基准图,2) 直接询问 OpenAI o1,3) 直接运行 MatPlotAgent 工作流,4) DSPy 优化过的工作流,以及 5) 由 Cognify 优化过的工作流。Cognify 优化过的工作流返回的结果几乎与基准图吻合,质量显著优于其他方案。与此同时,Cognify 优化过的工作流的运行成本仅有 o1-preview 的 4%。

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

图 A:人工画的基准

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

图 B:GPT o1-preview 的生成图

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

图 C:原生成式 AI 工作流的生成图

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

图 D:DSPy 优化过的生成式 AI 工作流生成图

质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

图 E:Cognify 优化过的生成式 AI 工作流生成图

GenseeAI 简介

GenseeAI(gensee.ai)是由 UCSD 张怡颖教授带领的初创公司。GenseeAI 致力于生成式 AI 工作流优化、部署、推理和基础平台创建,目前已在多家世界 500 强公司推广初期产品。张怡颖教授师从图领奖得主 David Patterson 学门,是计算机系统领域的国际顶尖专家,获得业界和学术界多项大奖和广泛认可。GenseeAI 的其他核心团队来自于美国谷歌和 Snap 等高科技公司,具有开发和运营日活跃用户上亿级别的 AI 产品的经验。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-05 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...景,同时生成新的提示和响应。它们还可以实现数据生成工作流的自动化,减少或消除某些任务对人工干预的需求。论文中,作者提出了「生成式教学」的概念。这是说,使用合成数据进行后训练,
2024-08-20 13:44:00
刚刚,李飞飞创业首个项目:单图生成交互3D场景,空间智能来了
...爱作品生成的,模型没有生成原画之外的任何东西。创意工作流World Labs 让 3D 世界生成自然地与其他 AI 工具组合在一起。这使得创作者可以使用他们已知的工具来实现新
2024-12-04 09:51:00
澎湃新闻CTO:迎接智媒时代,澎湃新闻如何拥抱AI浪潮
...用权限。直到将清穹内容风控智能平台能力全面嵌入AIGC工作流之后,这种情况发生了转变。清穹系统凭借先进的内容分析和审校能力,提供强有力的内容安全保障。澎湃新闻逐步放宽对AIG
2025-02-24 16:41:00
国内团队新发大模型:ceo上阵写代码
...的数据和信息。它的定位更偏向办公场景,提出改善人们工作流、提高效率的目标。比如让它来帮我写一条AppleVisionPro的新闻快讯,效果有模有样:或者写一个论文大纲,条理清
2023-06-07 21:01:00
36氪首发|AIGC自动化设计平台「Collov」完成近千万美元A轮融资,以工业级大模型服务家装设计
...还需要考虑流程问题。” 张霄直言,这也是室内设计师工作流程长、效率较低的重要原因。而如今的AIGC自动化设计能够更好地解决这些问题。图源:Collov生成式AI主要从四个方
2023-06-12 08:46:00
小库科技CEO何宛余:泛建筑设计领域的AIGC创享之路 | WISE2023颠覆AIGC产业发展峰会
...意向,实现“零门槛生成”、“无障碍炼丹”、“无缝接工作流”。以下是小库科技CEO何宛余的演讲实录(经36氪摘编):大家下午好!非常荣幸有机会和大家进行分享,我们在泛建筑设计领
2023-05-31 15:39:00
秒针系统赵洁:大模型落地营销领域,转化效果提高将近300%|36氪专访
...起了良好的市场反馈。这是一个利用大模型成功赋能商业工作流的案例。在大模型的帮助下,秒针团队发现爆品潜力,为品牌研发提供支持。明略科技高级副总裁、秒针系统总裁赵洁告诉36氪,大
2023-12-08 09:32:00
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...上,我们一直探索人机互动的内容协同模式,结合用户的工作流,包括智能空间布局算法,包括照明智能灯光算法,包括2D素材生成模型以及3D空间模型等AI算法在群核科技的产品矩阵中发挥
2024-05-28 09:06:00
微软Office全家桶再爆办公革命,o1模型加持重塑十亿人工作流!1句话生成PPT+自定义智能体
...半小时发布会,纳德拉向全世界宣告,「AI时代下的全新工作流开启」。Python塞进Excel,AI秒处理数据。而且
2024-09-18 12:04:00
更多关于科技的资讯: