• 我的订阅
  • 科技

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

类别:科技 发布时间:2024-11-04 09:52:00 来源:机器之心Pro
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

想象这样一个场景:你正在火锅店和朋友畅聊,一个机器人熟练地为你倒饮料、端菜,完全不需要你分心招呼服务员。这个听起来像科幻的场景,已经被清华大学交叉信息院的研究者们变成了现实!他们发现了具身智能领域的 “圣杯”——data scaling laws,让机器人实现了真正的零样本泛化,可以无需任何微调就能泛化到全新的场景和物体。这一突破性发现,很可能成为机器人领域的 “ChatGPT 时刻”,彻底改变我们开发通用机器人的方式!

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

视频链接:https://mp.weixin.qq.com/s/hJjE_C3KMn7gKjIvfXMhGg

从火锅店到电梯,机器人展现惊人泛化力

研究团队可不是只在实验室里玩玩具。他们把机器人带到了各种真实场景:火锅店、咖啡厅、公园、喷泉旁,甚至是电梯里。更令人震惊的是,机器人在这些前所未见的环境中都展现出了超强的适应能力!

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

视频链接:https://mp.weixin.qq.com/s/hJjE_C3KMn7gKjIvfXMhGg

为了确保研究的可复现性,团队慷慨地开源了所有资源,包括耗时半年收集的海量人类演示数据:

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

论文标题:Data Scaling Laws in Imitation Learning for Robotic Manipulation 论文链接:https://arxiv.org/abs/2410.18647 项目主页:https://data-scaling-laws.github.io/

连 Google DeepMind 的机器人专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义!

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

Scaling Laws:从 ChatGPT 到机器人的制胜法则

还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器人领域同样适用。事实上,真正的 scaling laws 包含数据、模型和算力三个维度,而本研究重点突破了最基础也最关键的数据维度。

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

视频链接:https://mp.weixin.qq.com/s/hJjE_C3KMn7gKjIvfXMhGg

研究团队使用便携式手持夹爪 UMI,在真实环境中收集了超过 4 万条人类演示数据。他们采用最新的 Diffusion Policy 方法从这些数据中学习机器人控制模型,并通过惊人的 15000 + 次实机测试进行严谨评估,最终发现了三个革命性的幂律关系:

模型对新物体的泛化能力与训练「物体」数量呈幂律关系。 模型对新环境的泛化能力与训练「环境」数量呈幂律关系。 模型对环境 - 物体组合的泛化能力与训练「环境 - 物体对」的数量呈幂律关系。

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

这意味着什么?简单说:只要有足够的数据,机器人就能像 ChatGPT 理解语言一样,自然地理解和适应物理世界!这一发现不仅证实了机器人领域与语言模型存在惊人的相似性,更为预测数据规模与模型性能的关系提供了坚实的理论基础。

颠覆性发现:数据收集原来要这么做!

研究团队还破解了一个困扰业界的难题:对于给定的操作任务,如何优化选择环境数量、物体数量和每个物体的演示次数?

经过大量实验,他们得出了两个出人意料的结论:

1. 当环境数量足够多时,在单一环境中收集多个不同的操作物体的数据收益极其有限 —— 换句话说,每个环境只需要一个操作物体的数据就够了。

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

2. 单个物体的演示数据很容易达到饱和 —— 在倒水和摆放鼠标等任务中,总演示数据达到 800 次时,性能就开始趋于稳定。因此,每个物体 50 次示范基本就能搞定。

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

为验证这个策略,团队找来 4 个人,只花了一个下午就收集到了训练数据。结果令人震惊:在 8 个全新场景中,机器人成功率高达 90%!这意味着,原本可能需要几个月的数据收集工作,现在可能只需要几天就能完成!

模型规模化探索的意外发现

除了数据规模,研究团队还在模型规模化方面有三个重要发现:

视觉编码器必须经过预训练和完整的微调,缺一不可 扩大视觉编码器的规模能显著提升性能 最令人意外的是:扩大扩散模型的规模却没能带来明显的性能提升,这一现象还值得深入研究

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

未来展望

数据规模化正在推动机器人技术走向新纪元。但研究团队提醒:比起盲目增加数据量,提升数据质量可能更为重要。关键问题在于:

如何确定真正需要扩展的数据类型? 如何最高效地获取这些高质量数据?

这些都是 Data Scaling Laws 研究正在积极探索的方向。相信在不久的将来,具有超强适应力的机器人将走进千家万户,让科幻电影中的场景变为现实!而这一切,都将从清华团队发现的这个基础性规律开始!

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-04 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

蔚蓝科技获超亿元A1轮融资,致力打造苹果级四足机器人产品
...部位于南京,是一家专注于为所有家庭和企业打造通用型机器人的创新企业,其主打的四足机器人产品阿尔法机器狗,在2021年3月C5系列产品首次开展商业化销售时就获得1万多订单。阿尔
2023-08-30 15:17:00
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT
2024-10-21 09:55:00
没赶上大模型的投资人 不想错过具身智能
...资人在那扫码约时间。”ChatGPT等生成式人工智能与人形机器人行业结合,开启了具身智能(Embodied Intelligence)的时代
2023-07-20 11:41:00
珠海加速布局具身智能!灵巧操作巅峰对决,官宣明年百万美元奖励
...聚了海内外众多具身智能人才参与到挑战赛之中,展现了机器人在各种灵巧操作任务中的巨大潜能,也打造了一个产学研深度结合的交流平台,推动着珠海在具身智能产业链攻关上更进一步。一、机
2024-11-08 09:48:00
“让机器人学会像我妈那样给我包饺子”
...青年报青年科学家展望具身通用人工智能的多彩未来“让机器人学会像我妈那样给我包饺子”具身通用人工智能论坛。 青年报记者刘秦春摄 青年报记者刘秦春本报讯“如果一个机器人只会侧空
2023-07-08 07:54:00
清华大学深圳国际研究生院3D打印混凝土技术“打印”城市公园
...17号馆前,用地面积5523.3平方米,建设过程中使用了四套机器人打印设备,从设计到建成用了近三个月的时间。作为全国第一个应用3D打印技术的城市绿地花园,深圳宝安3D打印公园
2023-02-02 07:00:00
前沿科技如何从“0”到“1”?
...家公司,致力于成为国际领先的医用视觉成像产品、医疗机器人和新型数字化手术室解决方案的提供商。“传统的显微镜需要医生俯身对准显微镜目镜,有着术中视线受限、体力消耗大、沟通不便等
2023-10-21 06:54:00
“我更喜欢到车间里去”
本文转自:解放日报研究了近40年机器人和智能制造杨向东的想法因为一次对话改变“我更喜欢到车间里去”朱凌君杨向东 浙江清华长三角研究院副院长 关注企业的真实需求,将科研样品转化为有
2024-06-12 05:54:00
清华教授为村民3D打印了一栋住宅,只花20多万
近5年来,清华大学徐卫国教授和团队,用“机器人3D打印混凝土”技术陆续“打印”了一座桥、一座书屋、数个公园,还为一对70后乡村夫妇打出一栋住宅——“打印”全程仅160小时,20多
2023-02-10 11:40:00
更多关于科技的资讯: