• 我的订阅
  • 科技

​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱

类别:科技 发布时间:2024-11-19 09:48:00 来源:机器之心Pro

多智能体系统,可自动化整个 ML 工作流程,节省数千小时工时。

Open AI 的推理模型 o1,这么快就被比下去了?

本周五,AI 社区见证了又一项突破:一个完全自动化机器学习流程的 AI 工程师,能轻松获得 Kaggle 大师水平,在参与的 50 个 Kaggle 竞赛上获得了其中 26% 的奖牌,成绩远远优于之前 Open AI 的强化学习加强版的 o1 模型。

创造这项纪录的 AI,来自一家名为 NEO 的创业公司。

​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱

据该公司介绍,NEO 可以自动化整个机器学习的工作流程,为开发人员节省数千小时的繁重工作。它是一个多智能体(AI Agent)系统,可用并行的方式解决单一问题。

目前这一 AI 系统还在内测申请阶段,除了视频 Demo 内容,我们还能找到官方的简单介绍:

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650943246&idx=2&sn=8d7970c864c74dabd9c063ff097d5cb2&chksm=84e7eb70b39062668ebb61bf3a3e3250f61ff6295424dc4b3e4316a152e2595e16053421e1a0&token=933530197&lang=zh_CN#rd

机器学习中的挑战

首先是 NEO 希望解决的问题。

机器学习的「从数据中学习」这一看似简单的前提掩盖了开发人员每天面临挑战的复杂性。虽然传统编程遵循明确的规则和逻辑路径,但机器学习引入了一系列新的不确定性,即使是经验丰富的开发人员也难以应对。从本质上讲,机器学习不仅需要代码开发的专业知识,还需要对统计学、线性代数和微积分有深入的理解,这是许多软件工程师自大学毕业后就不再遇到的数学问题。

开发人员面临的第一个障碍是数据质量和准备。原始数据很少以干净、直接可用的格式出现。相反,开发人员必须花费大量时间处理缺失值、异常值和不一致的格式,同时做出有关数据清理的关键决策,这可能会显著影响模型性能。

模型的选择带来了另一层复杂性。在解决某个问题时通常会有几十种算法可用,每种算法都有自己的优势和局限性,选择正确的方法成为一个关键的决策点。仅神经网络就提供了无数的架构可能性,从简单的前馈网络到 Transformer,每个模型都需要仔细调整超参数。

计算资源增加了另一个复杂性维度。虽然小型模型可以在笔记本电脑上运行,但很多机器学习开发通常需要云基础设施、分布式计算和 GPU 优化。开发人员必须熟练掌握 Docker、Kubernetes 和各种云平台等工具。

部署本身也带来了一系列挑战。在开发过程中表现优秀的模型可能会随着数据漂移而退化,需要持续监控和重新训练 pipeline。开发人员不仅必须跟踪代码更改,还必须跟踪数据版本、模型参数和训练配置。

这可能意味着开发人员要在每个步骤中投入数周或数月的工时,才能构建一个能够有效解决问题的 AI 模型。

NEO—— 完全自主的机器学习工程师

NEO 的出现大幅简化了这整套机器学习工作流程,使工程师能够以 10 倍的速度构建和部署 pipeline。它的开发充分考虑了机器学习专业人士的需求,并被设计为像实习生一样,能够从人类的反馈中进行学习。

它是如何运作的?NEO 是由多个智能体驱动多个专门模型实现的,每个微调模型专门用于机器学习生命周期的不同部分。

面对具体目标,NEO 会启动一套完整的工作流以达成目标。NEO 通过结构化的多步骤方法,将复杂问题拆解为易于管理的组件,化繁为简,从而实现目标。

这一方法包括计划、编码、执行和调试的持续循环,确保在每个阶段都进行充分优化。在这个过程中,NEO 会根据进展不断调整和迭代,直到获得最佳结果。一旦开发者批准 NEO 的输出,整个工作流程即可在几秒钟内部署。NEO 为机器学习工程师简化了上述所有复杂环节。

它的目标不是取代数据科学家或工程师,而是与人类合作并处理所有繁重任务。在人与 AI 合作的工作环境中,人们仅用几个小时就能完成一周的工作。

听起来有点像今年 3 月在 AI 社区爆火的首个 AI 软件工程师 Devin,不过多智能体的方法青出于蓝。

NEO 展示了一系列实际工作的 demo,当要求 NEO 构建一个信用卡欺诈检测系统时,它给出了流畅的任务解决方案。

当要求 NEO 使用协同过滤方法构建一本书籍推荐模型时,它自动完成了数据集的准备工作,还进行了探索性分析,并对数据预处理进行了结构性优化,使数据集能够更好地用于训练:

那么它的跑分如何呢?研究团队在 MLE 基准测试(MLE-bench)上对 NEO 进行了全面评估。MLE-bench 是一种创新的基准测试,专注于将 AI 智能体应用于真实世界的机器学习工程任务。与其他人工设计的挑战不同,这个基准测试通过 75 场实际的 Kaggle 竞赛来评估 AI 智能体在机器学习工程中的表现,具有极高的实用性。

在 50 场 Kaggle 竞赛测试中,NEO 表现堪称卓越:在 26% 的竞赛中获得奖牌,超越了 OpenAI 最新推理加强模型 o1 的基准成绩。为了更直观地理解这一成就,看看 NEO 到底是什么水准,Kaggle 金牌的获得要求就很直白:参赛团队需要进入所有团队排名前 10%。这通常需要极高的专业技能、创新方法以及精细优化。

这回落在 NEO 后面的,是搭配 AIDE 框架的 o1-preview 了。

​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱

NEO 在 50 场 Kaggle 比赛中进行了测试,并在其中 26% 的比赛中获得了奖牌,这一表现远远优于此前的搭配 AIDE 框架 Open AI 的 o1 在 MLE 基准测试中的 16.9% 的表现。

NEO 的表现不仅仅是数据,它代表了 AI 辅助机器学习工程的一个突破。凭借如此表现,NEO 已达到堪比 Kaggle 竞赛特级大师的水平,为用户带来了世界级的机器学习专业能力。

官方称,NEO 不仅仅是一款 AI 工具,而是一个像数据竞赛冠军一样的人类合作伙伴,随时准备解决复杂的数据挑战,以经过验证的竞赛获胜能力助你一臂之力。

NEO 的发布在 AI 社区引发了不小的关注,人们非常期待这款新工具能够帮助我们解决繁重的工作,不过也有人认为,目前的展示还只是一面之词,具体情况还得看网友实测。

​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱

多智能体的 AI 真的有如此高的潜力吗?让我们拭目以待。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-19 11:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...控制柜里的线路,做好本职工作就算合格了。那时,年长工程师们手持编程终端现场一坐就是一天,时间长了工程师腰就受不了,21岁的陆峻瞅准机会说:“我也想学!我来帮你输代码,你教我怎
2024-01-11 07:18:00
顶尖机器人赛事在武汉光谷开赛
...了当地的科教人才优势。决赛8月份举行,输出5万名青年工程师大赛开幕式上,光谷机器人生态创新中心正式揭牌。该中心定位为集卓越工程师培养、机器人创业孵化、赛事人才交流、公益科普教
2024-05-23 15:13:00
机甲大师全国赛于深圳收官,嘉立创助力研发创新的故事仍在续写
...国赛在深圳落下了帷幕,来自全国32所高校的近1000名青年工程师在赛场上挥洒热血青春,完成了机甲逐梦之旅。赛事虽已收官,助力硬件创新研发的故事仍在继续。嘉立创在为高校战队提供
2023-08-21 11:00:00
...小分析师等STEAM课程,引导学生“像科学家一样思考,像工程师一样实践”。(二)特色课程:探索自然奥秘,不断有所精进高师附小学校打造“U+N+M”课程,U即共生融合的必修型课
2023-09-08 00:18:00
武汉大学:造就机器人行业高素质人才
...师。同时,该班聘请企业界知名创新创业导师和行业顶尖工程师,共同组成导师团队,因材施教,指导学生开展课业学习、科研训练和工程实践。武汉大学机器人系将人工智能大模型与机器人结合作
2024-05-15 02:03:00
在宁职校搭建实训平台:工匠工程师“手把手”, 岗位技能“学到手”为企业发展新质生产力培养高技能人才□南京日报/紫金山新闻记者 何洁王怀艳3月26日,在高淳区东坝街道青枫村田埂边,
2024-04-07 07:29:00
大疆宣布停售教育应用产品
...势资源继续聚焦在大学生高校机器人赛事,致力于为青年工程师提供成长土壤,挖掘及培养有潜质的青年理工人才梯队,并持续向社会输出。大疆的这一决定表明了公司对于教育领域的重视,同时也
2024-01-04 13:21:00
特斯拉加速招聘optimus工程师
...1月1日消息,特斯拉正在加速招聘人形机器人项目Optimus的工程师,包括一些强化学习方面的专家。很多人对这个项目并不看好,认为它只是一个噱头。然而,特斯拉却非常认真地推进这
2023-11-01 13:44:00
焦点访谈丨了不起的匠人 个个有绝活!
...参加工程系列专业技术人才职称评审。陈亮也报名参加了工程师的职称评审。2023年4月,他一直期盼的正高级工程师终于评定了。2023年底,陈亮回到母校成为一名教师,专职培养新一代
2024-05-13 09:43:00
更多关于科技的资讯: