• 我的订阅
  • 科技

阿里推出AI数据科学家,全流程自动化,科研小白也能用

类别:科技 发布时间:2024-08-08 09:40:00 来源:量子位

基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了!

具体来说,Data Science Assistant(以下称DS Assistant)是基于Modelscope-Agent框架开发的数据科学助手。

有了它,我们只需给需求,这个助手就能自己跑完探索性数据分析(EDA)、数据预处理、特征工程、模型训练,模型评估等步骤。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

当然,除了本文将重点提到的DS Assistant,它背后的Modelscope-Agent框架也值得说道。

这个框架由阿里开源,主要特点包括:

可通过vllm、ollama等工具接入各主流开源模型,也可以直接调用模型API; 提供RAG组件支持开发者快速接入知识库; 工具生态丰富,支持大量的Modelscope社区模型作为工具,也支持直接调用langchain的工具,还接入了各类常用的工具,如web-browsing、文生图、code-interpreter等;

更妙的是,Modelscope-Agent框架允许开发者无需编码即可交互式地创建Agent助理。

这不,啪的一下,咱们的数据科学助手“诞生”了~

复杂数据科学任务自动化

实现复杂数据科学任务自动化一直存在挑战。

传统的ReAct(Reasoning and Action)框架对于简单的任务比较有效,但是有以下缺点:

每次工具调用都需要一个LLM调用。 LLM一次仅计划1个子问题。这可能会导致任务的轨迹更加不可控,因为它不会被迫“推理”整个任务。

而DS Assistant使用了plan-and-excute框架,这是一种新兴的Agent框架,通过明确计划和执行步骤高效完成复杂任务。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

langchain官网对Plan-and-execute Agent的描述:https://blog.langchain.dev/planning-agents/

具体而言,其工作流程包括以下几个步骤:

1、任务计划:Agent接收用户输入的任务描述,进行语义理解,将任务分解为多个可执行子任务。

2、子任务调度:基于任务之间的依赖关系和优先级,智能调度子任务的执行顺序。

3、任务执行:每个子任务分配给特定的模块执行。

4、结果整合:汇总各子任务的结果,形成最终输出,并反馈给用户。

基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的运转。

而Plan模块负责根据用户的需求生成一系列Task列表,并对Task先后顺序进行拓扑排序。

在这一阶段,DS Assistant根据用户输入的复杂数据科学问题,自动将其分解为多个子任务。

这些子任务根据依赖关系和优先级被组织和调度,确保执行顺序符合逻辑且高效。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

接下来到了Execution模块,负责任务的具体执行,保存任务执行结果。

在这里,每个子任务被具体化为可执行的操作,如数据预处理、模型训练等。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

最后是Memory management模块,负责记录任务中间执行结果,代码,数据详情等信息。

在所有Task执行完成后,DS Assistant会将中间数据的执行情况 ( 包括每个task生成的代码和结果,消耗token数,任务时间 ) 保存为文件。

案例实战

下面,我们以一个具体的例子来了解DS Assistant的执行过程。

我们选用Kaggle上的一个比赛任务ICR - Identifying Age-Related Conditions作为示例:

该任务是一项机器学习任务,主要目的是通过分析各种数据(如医疗记录、基因数据、生活方式数据等),识别与年龄相关的健康状况。

最终结果将用来帮助医疗专业人员及早发现老年人群中常见的健康问题,并提供个性化的预防和治疗方案。

废话不多说,我们这就开始~

阿里推出AI数据科学家,全流程自动化,科研小白也能用

首先,对于选用的LLM,我们需要配置一下。

我们引入MetaGPT的Data Science工具和Tool Recommender,可以根据任务类型向DS Assistant推荐合适的数据科学工具。

接着,我们需要将任务的具体要求传给DS Assistant。需要注意的是,在要求中需向DS Assistant指明数据文件的路径:

阿里推出AI数据科学家,全流程自动化,科研小白也能用

在Plan阶段,DS Assistant会根据用户需求生成任务列表,将整个数据处理流程进行分解,接着对任务列表进行按顺序处理。

可以看到,DS Assistant生成了5个任务,分别是数据探索,数据预处理,特征工程,模型训练和预测。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

然后这5个任务进入了Execute阶段,下面咱们挨个看一下。

Task 1: 数据探索

阿里推出AI数据科学家,全流程自动化,科研小白也能用

可以看到生成的代码在执行时报了如下错误,原因是没有引入numpy包。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

DS Assistant根据报错进行了反思,并重新生成代码并执行,成功输出数据探索的结果。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

最后,code judge会对代码进行质检,确保本次生成代码逻辑正确。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 2: 数据预处理

在数据预处理阶段,DS Assistant分别对数值型数据和类别型数据进行了合适的缺失值处理,并清除了ID列。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 3:特征工程

在修复了两次错误后,DS Assistant对数据进行了特征工程的处理,对类别型变量进行编码。

同时对之前定义的categorical_columns变量进行了更新,去除了ID列。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 4:模型训练

DS Assistant主动安装了合适的依赖,并选择了多个模型(随机森林,梯度提升,逻辑回归)进行训练,并选择了结果最好的模型。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 5:模型验证

DS Assistant选择了训练集中F1分数最高的模型对验证集进行测试,并计算了这个模型在验证集上的F1分数,成功地完成了任务。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

执行完以上任务后,DS Assistant支持将运行结果保存为Jupyter Notebook类型的文件,并记录运行的中间过程。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

△Jupyter Notebok

阿里推出AI数据科学家,全流程自动化,科研小白也能用

△中间过程记录JSON文件

实验效果

我们使用ML-Benchmark作为测试集(指路论文“Data Interpreter: An LLM Agent For Data Science”),分别从Normalized Performance Score (NPS) ,total time,total token三个维度对DS Assistant效果进行评测。

其中NPS是一种将不同任务或模型的性能指标标准化的方法,使得不同指标之间可以进行比较。

它的计算通常涉及以下步骤:

步骤1:确定指标优化方向,判断性能指标是“越大越好”还是“越小越好”。

步骤2:规范化计算。如果指标是“越大越好”(如准确率、F1分数、AUC),NPS等于原始值;如果指标是“越小越好”(如损失值),则需要将原始值映射到接近1的较高NPS值。

规范化后的性能得分范围通常是0到1,其中1表示最优性能,0表示最差性能。

实验任务详情和结果如下(绿色代表当前任务下最优指标 ):

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

可以看到,在部分复杂的数据科学任务上,DS Assistant在规范化性能得分(NPS),任务时间,消耗token数的指标上取得超过开源SOTA的效果。(其中开源SOTA效果指MetaGPT实测值)

完整实验日志:https://modelscope-agent.oss-cn-hangzhou.aliyuncs.com/resources/DS_Assistant_results.zip

总结

对不同的人来说,DS assistant有不同作用:

不熟悉数据分析流程但是又有需要的同学,可以快速根据生成的任务以及处理过程,了解处理数据的思路,以及技术点。 对于了解数据分析流程的同学,可以通过详细的描述,来影响数据处理的方法,方便做不同的实验参照比较。 对于所有人,可以自动化的快速实现对于当前手上文件的更深层次的理解,仅需提问即可。

下一步,DS assistant将从三个方向展开优化:

1、进一步提高任务执行成功率:

a)对于Code Agent来说,传入信息量过大(报错信息,中间数据信息,已生成代码信息)会导致模型生成代码正确率下降,可以在未来考虑使用LLM进行总结,对信息进行筛选。

b)同一个Task可进行进一步的分解,以降低对LLM推理能力的要求。

2、对话交互式,可以将任务和任务的执行展示分开,通过对话的方式推进任务,并影响执行结果。

3、支持批处理相同任务多批文件的场景。

更多细节可进一步查看Modelscope-Agent官方仓库中Data Sciecne Assistant示例。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-08 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为、腾讯、阿里云都出手了,这一看似艰深的领域,正撬动医药、天文气象……
...子电池和钙钛矿电池等。除了AI制药,科学智能还能帮助科学家们“仰望星空”。从探星到气象预测,AI在不断拓展新的可能。此次大会上展示的华为云盘古气象大模型,是全球首个精度超过传
2023-07-06 11:50:00
世界人工智能大会开幕:马斯克、华为胡厚崑共话AIGC,谷歌、特斯拉展示AI能力
...药物分子大模型、盘古气象大模型和海浪大模型。华为与科学家共同合作,取得很好的进展。胡厚崑在结尾透露,华为将于7月7日全球开发者大会上发布华为的盘古大模型3.0,从而为千行百业
2023-07-06 22:00:00
...《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并
2024-09-12 07:47:00
深势科技发布科学大模型体系“深势宇知” 引领共建AI for Science开放科学生态
...for Science 开放科学生态发布会上,深势科技创始人兼首席科学家张林峰进行了题为“重构世界,从原子开始”的主题分享。他认为,过去十多年,我们在比特(互联网)层面取得了
2024-04-12 22:13:00
深势科技发布科学大模型体系“深势宇知?”,引领共建AI for Science开放科学生态
...学研,共建AIforScience开放科学生态深势科技创始人兼首席科学家张林峰进行了题为“重构世界,从原子开始”的主题分享。张林峰博士表示:“过去十多年来,我们在比特(互联网
2024-04-13 15:52:00
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
【新智元导读】世界首个能写完整会议论文的「AI科学家」来了!不仅只需15美元就能写一篇论文,而且质量也已被「AI审稿人」判定为达到了机器学习顶会Weak Accept的水准。世界
2024-08-14 13:55:00
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...构发布了最新的OpenScholar系统,使用检索增强的方法帮助科学家进行文献搜索和文献综述工作,而且做到了数据、代码
2024-11-27 13:33:00
AI赋能电网“智慧大脑”!专家:产业应用引领AI新浪潮
...lpha fold,在发现蛋白质结构方面的能力已经超过了一流的科学家,挑战着他们毕生的专业经验。ChatGPT则通过聊天这一场景,为自然语言处理带来了全新的变革。拿南方电网来
2023-02-18 15:19:00
中国科大机器化学家采用火星陨石智能创制产氧电催化剂
...作,通过机器化学家“小来”系统,高效融合人工智能和自动化机器实验完成的。机器化学家探索星际资源的原位利用示意图。中国科大供图。移居火星,首先要克服的是缺乏氧气的火星环境。火星
2023-11-14 10:38:00
更多关于科技的资讯:
Airbnb店铺该如何推广
Airbnb是一个全球性的在线短租平台,世界各地的房东都可以在这将空闲房产出租给来自全球的旅行者。今天带大家了解一些策略和方法
2025-04-03 11:18:00
‌家家悦和瑞广场店焕新升级盛大开业 与您共赴美好生活
4月3日,家家悦和瑞广场店改造全新面貌盛大开业。家家悦和瑞广场店是继环宇城升级改造的第二家门店。作为一家社区综超门店,和瑞广场店经营面积1000余平
2025-04-03 11:20:00
当减肥遇上黑科技 年轻人找到了“快乐减肥”的秘诀
在快节奏的现代生活中,体重管理已不再是个人选择,而是关乎全民健康素养的公共议题。而传统减肥方式始终无法突破人性的桎梏。健身房里的跑步机沦为晾衣架
2025-04-03 11:21:00
“与中国同行就是与机遇同行,相信中国就是相信明天,投资中国就是投资未来”。3月28日,国家主席习近平在北京人民大会堂会见国际工商界代表时
2025-04-03 11:21:00
近年来,随着经济复苏进程加快,市场需求也愈加多元,金融机构紧跟政策引导,不断通过创新活动与产品,扩内需,助惠民,推动消费提质扩容
2025-04-03 11:23:00
君乐宝:深耕益生菌研发,领航乳品创新之路
在竞争激烈的乳品市场中,君乐宝乳业集团凭借其深厚的益生菌研发实力,不仅赢得消费者的广泛认可,更在行业内树立起科研创新的标杆
2025-04-03 11:26:00
这种看似自由的生活态度:正在杀死你的“活人感”
周末醒来的早晨,手机弹出了健身教练的课程邀请。犹豫一下,想起要找装备换衣服就觉得好麻烦,于是顺手划掉通知,想着“算了算了
2025-04-03 11:41:00
腾讯稳居全球移动发行商收入榜第一!字节跳动排第二
快科技4月3日消息,近日,Sensor Tower发布了《2024年全球移动发行商收入TOP50》榜单。据了解,在2024年
2025-04-03 11:41:00
吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf记录居第一
快科技4月3日消息,NVIDIA在官网表示,在最新的MLPerf V5.0基准测试中,NVIDIA的Blackwell平台取得了令人瞩目的成绩
2025-04-03 11:41:00
20多万的长城灵魂摩托供不应求 二手平台有人加价5千元转订
快科技4月3日消息,因为长城灵魂摩托采用限量发售的形式,基本上每次新一批车源都很快被抢购一空,这也导致不少车主无法成功抢到车
2025-04-03 11:41:00
山西怀仁3.6级地震:震源深度15千米
快科技4月3日消息,中国地震台网正式测定:04月03日09时53分在山西朔州市怀仁市(北纬39.81度,东经113.16度)发生3
2025-04-03 11:41:00
全球唯一!劳斯莱斯幻影定制版亮相:25万针绣出\
快科技4月3日消息,劳斯莱斯发布了幻影“春日花见”定制版车型官图。这款车型由一位日本客户委托定制,灵感源自日本传统“花见”习俗
2025-04-03 11:41:00
6999元起 华为智慧屏S6 Pro开售:支持灵犀指向遥控
快科技4月3日消息,华为智慧屏S6 Pro正式开售,号称为全家人的“巨幕手机”,售价6999元起。据悉,华为智慧屏S6 Pro配备了灵犀指向遥控器
2025-04-03 11:41:00
正益信息:用专业赋能,领航行业数字化变革
在数字化建设的浪潮中,众多行业对网络基础设施的需求愈发迫切。广州市正益信息技术有限公司凭借过硬的技术实力与丰富的行业经验
2025-04-03 11:46:00
廊坊:以旧换新加力扩围 “催旺”家电数码消费市场
河北新闻网讯(记者刘杰)“家电以旧换新,政府补贴20%,单件最高补贴2000元……”3月30日,在廊坊市区明珠集团电器卖场举办的2025春季品质家电焕新家装节现场
2025-04-03 11:54:00