• 我的订阅
  • 科技

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

类别:科技 发布时间:2024-10-10 09:57:00 来源:机器之心Pro

最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

GR-2 官方项目页面:

https://gr2-manipulation.github.io

初识 GR-2:百炼出真金

和许多大模型一样,GR-2 的训练包括预训练和微调两个过程。

如果把机器人和人做比较,预训练过程就好像是人类的 “婴儿期”。而 GR-2 的婴儿期与其他机器人截然不同。

在预训练的过程中,GR-2 在互联网的海洋中遨游。

它在 3800 万个互联网视频片段上进行生成式训练,也因此得名 GR-2(Generative Robot 2.0)。这些视频来自学术公开数据集,涵盖了人类在不同场景下(家庭、户外、办公室等)的各种日常活动。

这个过程,就像是它在经历一个快速的 “生长痛”,迅速学会了人类日常生活中的各种动态和行为模式。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

该图展示了 GR-2 预训练数据中的样本视频和动词分布。下图中的 y 轴是最热门单词的对数频率。

这种预训练方式使 GR-2 具备了学习多种操作任务和在多种环境中泛化的潜能。庞大的知识储备,让 GR-2 拥有了对世界的深刻理解,仿佛它已经环游世界无数次。

微调的艺术:视频生成能力拔高动作准确率

据悉,GR-2 的开发团队采用了一种创新的微调方法。

在经历大规模预训练后,通过在机器人轨迹数据上进行微调,GR-2 能够预测动作轨迹并生成视频。

GR-2 的视频生成能力,让它在动作预测方面有着天然的优势。它能够通过输入一帧图片和一句语言指令,预测未来的视频,进而生成相应的动作轨迹。

以下是几个进一步展示 GR-2 视频生成能力的示例,包括把物品放进烤箱、将物品置于咖啡壶嘴下方等任务。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

这种能力,不仅提升了 GR-2 动作预测的准确性,也为机器人的智能决策提供了新的方向。

Scaling Law:机器人 + 大模型的要诀

在人工智能领域,Scaling Law 是一个备受瞩目的概念。它描述了模型性能与其规模之间的关系。对于 GR-2 这样的机器人模型来说,这一法则尤为关键。

随着模型规模的增加,GR-2 的性能呈现出显著的提升。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

(a)(b)(c) 分别展示了不同尺寸 GR-2 在 Ego4d、RT-1、GR-2 三个数据集的验证集上的视频生成损失。(d) 展示了不同尺寸 GR-2 在真机实验中的成功率。

在 7 亿参数规模的验证中,团队看到了令人鼓舞的结果:更大的模型不仅能够处理更多复杂的任务,而且在泛化到未见过的任务和场景时也表现得更加出色。

这表明,通过扩大模型规模,我们可以解锁机器人更多的潜能,使其在多任务学习和适应新环境方面更加得心应手。

多任务学习与泛化:未知场景的挑战者

在多任务学习测试中,GR-2 能够完成 105 项不同的桌面任务,平均成功率高达 97.7%。

GR-2 的强大之处不仅在于它能够处理已知任务,更在于其面对未知场景和物体时的泛化能力。无论是全新的环境、物体还是任务,GR-2 都能够迅速适应并找到解决问题的方法。

我开、我放……我眼里有活儿

更让人惊艳的是,GR-2 还能够与大语言模型相结合,完成复杂的长任务,并与人类进行互动。

比如,我们想要喝一杯咖啡。GR-2 会先从托盘里拿起杯子,并将其放在咖啡壶嘴下方。接着,它会按下咖啡机上的按钮来煮一杯咖啡。最后,当咖啡煮好了,机器人会把杯子放回托盘上。整个过程无需人类干预。

又如,我们早餐想要吃点东西。根据场景中的物体,机器人决定为我们制作一份烤面包。机器人首先按下烤面包机上的开关来烤制面包。然后它拿起烤好的面包,并将其放入红色的碗中。

ByteDance Research 还想强调,GR-2 能够鲁棒地处理环境中的干扰,并通过适应变化的环境成功完成任务。

工业应用中的突破:端到端的丝滑物体拣选

在实际应用中,GR-2 相比前一代的一个重大突破在于能够端到端地完成两个货箱之间的物体拣选。

这个任务要求机器人从一个货箱中逐个拿起物体,并将其放入旁边的货箱。看似简单,但在实际应用中,能够实现这个需求的多模态端到端模型却难得一见。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

端到端拣选任务场景

真 · 无情的拣选机器人

无论是透明物体、反光物体、柔软物体还是其他具有挑战性的物体,GR-2 均能准确抓取。这展现了其在工业领域和真实仓储场景的巨大潜力。

除了能够处理多达 100 余种不同的物体,例如螺丝刀、橡胶玩具、羽毛球,乃至一串葡萄和一根辣椒,GR-2 在未曾见过的场景和物体上也有着出色的表现。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

拣选任务中的 122 个测试物品,其中只有 55 个物体参与训练。

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模

GR-2 可以识别透明的、可变形的或反光的物体。

话分两头,尽管 GR-2 在互联网视频上接受了大规模的预训练,但也存在一些进步空间。例如,真实世界动作数据的规模和多样性仍然有限。

GR-2 的故事,是关于 AI 如何推动机器人发展的故事。它不仅仅是一个机器人大模型,更是一个能够学习和适应各种任务的智能体。我们有理由相信,GR-2 在实际应用中拥有巨大潜力。

GR-2 的旅程,才刚刚开始。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-10 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国泰君安证券:具身智能,人工智能的下一个浪潮
...Disembodiment),指的是认知与身体解耦(ChatGPT为代表的大模型就仅仅实现了离身智能);“智能”代表智能体(生物或机械)通过与环境产生交互后,通过自身学习,产
2023-06-30 10:01:00
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)
2024-04-15 10:13:00
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述
2024-07-29 09:39:00
机器人轻松模仿人类,还能泛化到不同任务和智能体
...出图像目标表示(IGOR,Image-GOal Representation),“投喂”模型人类与现实世界的交互数据
2024-10-23 12:05:00
北大提出首个通用指令导航大模型系统 | CoRL 24
...教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。不论是寻找物体,走到指定位置,还是满足抽象的人类需求
2024-09-13 13:38:00
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,Ope
2024-03-18 10:00:00
全球首例机器人刮胡子,斯坦福校友1年拿下3轮数亿融资!红杉领投圈内热门
...(Plug and Play China)、MFund魔量资本等知名创投基金。在大模型风靡的2024年,如果说AI领域还有哪些热点
2024-12-06 09:55:00
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...,餐厅、超市、办公室、家庭等89个不同场景类别。由大模型驱动的NPC,可以在这个世界里和机器人对话交互。这样一来,各种机器人能在虚拟小镇里完成各种行为模拟,也就是最近流行的S
2024-07-23 09:33:00
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
今天,世界见证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT ,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛
2024-10-21 09:55:00
更多关于科技的资讯:
“贵州白酒云展会”数字化平台于“一码贵州”正式上线
多彩贵州网讯 9月9日,在第十四届中国(贵州)国际酒类博览会盛大开幕之际,“贵州白酒云展会”数字化平台于“一码贵州”正式上线
2025-09-10 00:50:00
投洽会期间厦门火炬高新区共有41个项目完成签约 计划总投资约433亿元
投洽会上,火炬高新区企业展示的芯片产品吸引客商关注。(本组图/厦门日报全媒体记者 卢剑豪 摄)多家位于火炬高新区的专精特新“小巨人”企业亮相投洽会
2025-09-09 08:44:00
刚刚过去的暑假,“工厂游”火爆出圈。多地工厂纷纷敞开大门,推出丰富多彩的研学项目。而在社交平台上,“工厂游”的攻略被大量转发
2025-09-09 08:46:00
东南网9月8日讯(通讯员 苏培婷)9月5日,由大田县总工会、国网大田县供电公司联合主办,国网大田县供电公司工会承办的首届“电力工匠”职业技能竞赛AI技术应用项目比赛圆满落幕
2025-09-09 09:28:00
本报讯 作为中国洗涤用品工业协会主办的行业盛会,第45届(2025)中国洗涤用品行业年会与第17届中国国际日化产品原料及设备包装展览会(以下简称“中国国际日化展”)将于今年10月15日至17日在重庆国际博览中心举行
2025-09-09 10:44:00
摩登中国时尚展传递中国皮革强音
本报记者 解 磊 文/摄为了满足人们对鞋包服饰等消费需求,为国际国内品牌企业、特色区域、独立设计师提供一个高端商贸合作
2025-09-09 10:44:00
近年来,我国消费市场涌现出许多新亮点,其中一个令人意外却极具代表性的现象是:碳纤维最大应用市场,竟然不是航空航天或风电叶片
2025-09-09 10:45:00
获SIAL创新金奖:纸沙拉沙拉脆片掀起零食健康新主张
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。湖南立方体食品有限公司选送的产品纸沙拉沙拉脆片荣获金奖
2025-09-09 11:17:00
王腾发微博辟谣:有失职,但没有窃取机密出售
9月8日,王腾发布离开小米的微博,当天,“小米王腾因泄密被辞退”登上热搜。此前,2023年8月25日,王化曾发博表示,欢迎王腾回京~好好干
2025-09-09 11:18:00
王腾深夜发文离开小米,其曾被赠“谨言慎行”T恤
9月8日晚,中国区市场部总经理、REDMI品牌总经理王腾发布微博:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价
2025-09-09 11:18:00
前零一万物联创戴宗宏创业:20人团队,能干上百人的AI定制项目
文|周鑫雨编辑|苏建勋国内市场、ToB、定制化——每个词都踩到了当下AI创业的雷点上。但这恰恰是前零一万物联合创始人戴宗宏
2025-09-09 15:19:00
不再低调的二次元,正在经营一种「痛系生活」
撰文|深海 封面来源|视觉中国 刚刚过去的这个夏天,上海俨然变成了一座二次元年轻人的“痛城”。 7月开始,几大动漫展会接连袭来
2025-09-09 21:51:00
全棉时代官宣孙颖莎为全球品牌代言人
9月8日,全棉时代官宣乒乓球运动员孙颖莎为全球品牌代言人,为旗下棉柔巾品类代言。双方将携手传递舒适、健康、环保的全棉生活方式
2025-09-09 14:30:00
京东超市11周年发布新战略 未来三年用户数从3亿将增至5亿
京东超市11周年发布会8日在北京举行,全球快消行业超400家知名品牌负责人、高管齐聚一堂。面对全球零售业遇到的多重挑战
2025-09-09 15:02:00
中秋至味 团圆共飨|好太太2025中秋礼盒上线啦!
月满人间,礼寄相思好太太中秋诚挚献礼好太太中秋礼盒是家的味道,更是爱的传递礼盒产品线下各大商超均有售卖欢迎各企事业单位
2025-09-09 15:19:00