• 我的订阅
  • 科技

阿里推出AI数据科学家,全流程自动化,科研小白也能用

类别:科技 发布时间:2024-08-08 09:40:00 来源:量子位

基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了!

具体来说,Data Science Assistant(以下称DS Assistant)是基于Modelscope-Agent框架开发的数据科学助手。

有了它,我们只需给需求,这个助手就能自己跑完探索性数据分析(EDA)、数据预处理、特征工程、模型训练,模型评估等步骤。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

当然,除了本文将重点提到的DS Assistant,它背后的Modelscope-Agent框架也值得说道。

这个框架由阿里开源,主要特点包括:

可通过vllm、ollama等工具接入各主流开源模型,也可以直接调用模型API; 提供RAG组件支持开发者快速接入知识库; 工具生态丰富,支持大量的Modelscope社区模型作为工具,也支持直接调用langchain的工具,还接入了各类常用的工具,如web-browsing、文生图、code-interpreter等;

更妙的是,Modelscope-Agent框架允许开发者无需编码即可交互式地创建Agent助理。

这不,啪的一下,咱们的数据科学助手“诞生”了~

复杂数据科学任务自动化

实现复杂数据科学任务自动化一直存在挑战。

传统的ReAct(Reasoning and Action)框架对于简单的任务比较有效,但是有以下缺点:

每次工具调用都需要一个LLM调用。 LLM一次仅计划1个子问题。这可能会导致任务的轨迹更加不可控,因为它不会被迫“推理”整个任务。

而DS Assistant使用了plan-and-excute框架,这是一种新兴的Agent框架,通过明确计划和执行步骤高效完成复杂任务。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

langchain官网对Plan-and-execute Agent的描述:https://blog.langchain.dev/planning-agents/

具体而言,其工作流程包括以下几个步骤:

1、任务计划:Agent接收用户输入的任务描述,进行语义理解,将任务分解为多个可执行子任务。

2、子任务调度:基于任务之间的依赖关系和优先级,智能调度子任务的执行顺序。

3、任务执行:每个子任务分配给特定的模块执行。

4、结果整合:汇总各子任务的结果,形成最终输出,并反馈给用户。

基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的运转。

而Plan模块负责根据用户的需求生成一系列Task列表,并对Task先后顺序进行拓扑排序。

在这一阶段,DS Assistant根据用户输入的复杂数据科学问题,自动将其分解为多个子任务。

这些子任务根据依赖关系和优先级被组织和调度,确保执行顺序符合逻辑且高效。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

接下来到了Execution模块,负责任务的具体执行,保存任务执行结果。

在这里,每个子任务被具体化为可执行的操作,如数据预处理、模型训练等。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

最后是Memory management模块,负责记录任务中间执行结果,代码,数据详情等信息。

在所有Task执行完成后,DS Assistant会将中间数据的执行情况 ( 包括每个task生成的代码和结果,消耗token数,任务时间 ) 保存为文件。

案例实战

下面,我们以一个具体的例子来了解DS Assistant的执行过程。

我们选用Kaggle上的一个比赛任务ICR - Identifying Age-Related Conditions作为示例:

该任务是一项机器学习任务,主要目的是通过分析各种数据(如医疗记录、基因数据、生活方式数据等),识别与年龄相关的健康状况。

最终结果将用来帮助医疗专业人员及早发现老年人群中常见的健康问题,并提供个性化的预防和治疗方案。

废话不多说,我们这就开始~

阿里推出AI数据科学家,全流程自动化,科研小白也能用

首先,对于选用的LLM,我们需要配置一下。

我们引入MetaGPT的Data Science工具和Tool Recommender,可以根据任务类型向DS Assistant推荐合适的数据科学工具。

接着,我们需要将任务的具体要求传给DS Assistant。需要注意的是,在要求中需向DS Assistant指明数据文件的路径:

阿里推出AI数据科学家,全流程自动化,科研小白也能用

在Plan阶段,DS Assistant会根据用户需求生成任务列表,将整个数据处理流程进行分解,接着对任务列表进行按顺序处理。

可以看到,DS Assistant生成了5个任务,分别是数据探索,数据预处理,特征工程,模型训练和预测。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

然后这5个任务进入了Execute阶段,下面咱们挨个看一下。

Task 1: 数据探索

阿里推出AI数据科学家,全流程自动化,科研小白也能用

可以看到生成的代码在执行时报了如下错误,原因是没有引入numpy包。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

DS Assistant根据报错进行了反思,并重新生成代码并执行,成功输出数据探索的结果。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

最后,code judge会对代码进行质检,确保本次生成代码逻辑正确。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 2: 数据预处理

在数据预处理阶段,DS Assistant分别对数值型数据和类别型数据进行了合适的缺失值处理,并清除了ID列。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 3:特征工程

在修复了两次错误后,DS Assistant对数据进行了特征工程的处理,对类别型变量进行编码。

同时对之前定义的categorical_columns变量进行了更新,去除了ID列。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 4:模型训练

DS Assistant主动安装了合适的依赖,并选择了多个模型(随机森林,梯度提升,逻辑回归)进行训练,并选择了结果最好的模型。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

Task 5:模型验证

DS Assistant选择了训练集中F1分数最高的模型对验证集进行测试,并计算了这个模型在验证集上的F1分数,成功地完成了任务。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

执行完以上任务后,DS Assistant支持将运行结果保存为Jupyter Notebook类型的文件,并记录运行的中间过程。

阿里推出AI数据科学家,全流程自动化,科研小白也能用

△Jupyter Notebok

阿里推出AI数据科学家,全流程自动化,科研小白也能用

△中间过程记录JSON文件

实验效果

我们使用ML-Benchmark作为测试集(指路论文“Data Interpreter: An LLM Agent For Data Science”),分别从Normalized Performance Score (NPS) ,total time,total token三个维度对DS Assistant效果进行评测。

其中NPS是一种将不同任务或模型的性能指标标准化的方法,使得不同指标之间可以进行比较。

它的计算通常涉及以下步骤:

步骤1:确定指标优化方向,判断性能指标是“越大越好”还是“越小越好”。

步骤2:规范化计算。如果指标是“越大越好”(如准确率、F1分数、AUC),NPS等于原始值;如果指标是“越小越好”(如损失值),则需要将原始值映射到接近1的较高NPS值。

规范化后的性能得分范围通常是0到1,其中1表示最优性能,0表示最差性能。

实验任务详情和结果如下(绿色代表当前任务下最优指标 ):

阿里推出AI数据科学家,全流程自动化,科研小白也能用

阿里推出AI数据科学家,全流程自动化,科研小白也能用

可以看到,在部分复杂的数据科学任务上,DS Assistant在规范化性能得分(NPS),任务时间,消耗token数的指标上取得超过开源SOTA的效果。(其中开源SOTA效果指MetaGPT实测值)

完整实验日志:https://modelscope-agent.oss-cn-hangzhou.aliyuncs.com/resources/DS_Assistant_results.zip

总结

对不同的人来说,DS assistant有不同作用:

不熟悉数据分析流程但是又有需要的同学,可以快速根据生成的任务以及处理过程,了解处理数据的思路,以及技术点。 对于了解数据分析流程的同学,可以通过详细的描述,来影响数据处理的方法,方便做不同的实验参照比较。 对于所有人,可以自动化的快速实现对于当前手上文件的更深层次的理解,仅需提问即可。

下一步,DS assistant将从三个方向展开优化:

1、进一步提高任务执行成功率:

a)对于Code Agent来说,传入信息量过大(报错信息,中间数据信息,已生成代码信息)会导致模型生成代码正确率下降,可以在未来考虑使用LLM进行总结,对信息进行筛选。

b)同一个Task可进行进一步的分解,以降低对LLM推理能力的要求。

2、对话交互式,可以将任务和任务的执行展示分开,通过对话的方式推进任务,并影响执行结果。

3、支持批处理相同任务多批文件的场景。

更多细节可进一步查看Modelscope-Agent官方仓库中Data Sciecne Assistant示例。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-08 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为、腾讯、阿里云都出手了,这一看似艰深的领域,正撬动医药、天文气象……
...子电池和钙钛矿电池等。除了AI制药,科学智能还能帮助科学家们“仰望星空”。从探星到气象预测,AI在不断拓展新的可能。此次大会上展示的华为云盘古气象大模型,是全球首个精度超过传
2023-07-06 11:50:00
世界人工智能大会开幕:马斯克、华为胡厚崑共话AIGC,谷歌、特斯拉展示AI能力
...药物分子大模型、盘古气象大模型和海浪大模型。华为与科学家共同合作,取得很好的进展。胡厚崑在结尾透露,华为将于7月7日全球开发者大会上发布华为的盘古大模型3.0,从而为千行百业
2023-07-06 22:00:00
...《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并
2024-09-12 07:47:00
数字时代的“脑力”革命!总台《赢在AI+》探索“智能芯算”
...想者曾琢借助AI推动实验室效率指数级进化,其开发的AI自动化合成平台,将传统需要三人协作的化学实验流程,转变为由AI主导的智能化系统,一键完成化合物的设计、合成、测试全流程。
2025-07-04 11:55:00
人工智能助力科学发现之路
...AI for Science创新图谱》(以下简称《报告》)显示,全球科学家正不断将机器学习等人工智能技术应用于科学研究各领域。人工智能通过变革科研范式、提升科研效率,推动物理
2025-04-10 03:46:00
第三届智能科学家生态联盟年会在中国科大举办
大皖新闻讯 2025年9月20日,第三届智能科学家生态联盟年会在中国科学技术大学隆重开幕。本届年会以“书同文、车同轨:智能标准引领未来”为主题,致力于推广智能科学家标准实施,构建
2025-09-20 19:46:00
深势科技发布科学大模型体系“深势宇知” 引领共建AI for Science开放科学生态
...for Science 开放科学生态发布会上,深势科技创始人兼首席科学家张林峰进行了题为“重构世界,从原子开始”的主题分享。他认为,过去十多年,我们在比特(互联网)层面取得了
2024-04-12 22:13:00
碧迪医疗首台本土化生产流式细胞仪BD FACSLyric生产下线
...床医护人员提供安全、高效的护理给药流程,协助实验室科学家们更有效地诊断疾病,并提升科研人员研发新一代诊断及治疗疾病的能力。碧迪医疗在几乎所有国家均设有分支机构,与全球范围内的
2025-08-08 20:05:00
深势科技发布科学大模型体系“深势宇知?”,引领共建AI for Science开放科学生态
...学研,共建AIforScience开放科学生态深势科技创始人兼首席科学家张林峰进行了题为“重构世界,从原子开始”的主题分享。张林峰博士表示:“过去十多年来,我们在比特(互联网
2024-04-13 15:52:00
更多关于科技的资讯:
虎鲸文娱发布《2025国庆假期文娱消费报告》票房火热 大屏“圈粉”南报网讯(记者鲁舒婷)10月8日,虎鲸文娱发布的《2025国庆假期文娱消费报告》(以下简称《报告》)显示
2025-10-10 07:32:00
名创优品MINISO深耕IP战略:岭南骑楼店开业首日引爆Z世代消费热潮
2025年8月17日,名创优品MINISO LAND华南首店于广州北京路步行街正式开业。该店以百年岭南骑楼为空间载体,融合超过100个全球热门IP
2025-10-09 11:15:00
荣耀Magic8系列发布会官宣定档10月15日
10月9日,荣耀官方正式宣布,主题为“开新局・见未来”的荣耀 Magic8 系列暨 Magic OS10 发布会将于10 月15日正式举行
2025-10-09 11:30:00
局部降水量80毫米以上!10—14日烟台市将有持续连阴雨天气
齐鲁晚报·齐鲁壹点 周宣刚10月7日10时,烟台市气象局发布10—14日连阴雨天气预报和大风警报。受高空槽东移和暖湿气流输送北上的水汽影响
2025-10-09 11:31:00
权威发布, 福瑞达颐莲品牌价值评估突破120亿
2025年9月25日,在中国香料香精化妆品工业协会主办的“2025中国香妆品牌价值大会”上,福瑞达生物股份旗下颐莲品牌凭借卓越的市场表现与品牌影响力
2025-10-09 11:32:00
持续创新高!高德扫街榜上线23天用户超4亿
这个国庆黄金周,高德APP和高德扫街榜正在持续创新高——10月3日,高德扫街榜宣布:上线仅23天,累计用户超4亿。10月1日
2025-10-09 11:33:00
国庆中秋,大马再掀中餐热潮!“鱼你速度”树出海标杆!
国庆中秋双节期间,马来西亚再度掀起中餐热潮!以“鱼你在一起”为代表的中餐连锁品牌,在当地各大商圈持续引爆消费热情。“6个月
2025-10-09 11:34:00
开启商超智慧储鲜,澳柯玛新品冷柜让食材更鲜活
鲁网10月9日讯当社区团购爆单时冰柜塞不下?当生鲜进货量太大冻不透?当网红雪糕因串味被迫贱卖?针对这些让商超、饭馆等用户抓狂的痛点
2025-10-09 11:40:00
鸡排哥8天假期涨粉超40万,节前已成立工作室,10月9日休息一天
10月8日,江西景德镇鸡排哥在个人社交账号发布一则视频,向全国各地来到家乡景德镇游玩和打卡买鸡排的游客表示感谢。鸡排哥表示近期天气炎热
2025-10-09 12:09:00
大疆部分产品直降千元!消费者炸锅,官方回应
10月8日,大疆在官网提前挂出“双十一”促销信息,多款产品价格直降数百至上千元。此次降价幅度较大。从几百元到几千元不等
2025-10-09 13:45:00
单日游客最高突破6.9万人次 忠县橘若·忠州渡接住“泼天流量”
这个国庆假期,重庆忠县江畔的橘若·忠州渡结结实实地“火”出了圈,八天揽客30余万人次,游客单日最高接待量突破6.9万人次
2025-10-09 13:57:00
谷子科技“智慧票根”创新亮相2025和平精英PEL运动会
10月7日,由谷子科技集团、和平精英职业联赛(PEL)与腾讯音乐娱乐集团联合出品,腾讯音乐娱乐集团与安徽易趣网络科技有限公司承办
2025-10-09 14:01:00
KPRO肯律轻食广州市场喜迎三十店庆十店同开彰显品牌活力
近日,肯德基旗下能量轻食品牌KPRO肯律轻食在广州、佛山及惠州三地,同步新开十家门店,标志着其在广州市场门店总数突破三十家
2025-10-09 14:01:00
告别失眠困扰!2025年备受瞩目的十大助眠药综合评估与选购参考
夜深人静,却辗转反侧;闹钟响起,仍昏沉乏力——这已成为当代太多人的真实写照。世界卫生组织研究表明,持续的睡眠障碍不仅是生活质量的杀手
2025-10-09 14:03:00
布鲁可携新品类、新系列、新产品亮相WF2025,全面展现\
10月2日-3日,中国规模最大、最专业的手办模型展Wonder Festival 2025(以下简称:WF2025)在上海正式开幕
2025-10-09 14:50:00