• 我的订阅
  • 科技

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

类别:科技 发布时间:2023-09-12 14:20:00 来源:DeepTech深科技

借助机器人的本体感觉对足式运动进行研究已有数十年。在以往的研究手段中,研究人员往往采用基于模型的方法开发神经网络控制器。但是,这类方法无法在那些现实世界里没有见过的环境中得到应用。

近年来,为了获得更好的泛化性和鲁棒性,研究者们开始采用无模型强化学习,在模拟中训练控制器,然后将学习到的策略直接转移到真实的机器人上。

那么,如何在无需遥控器操控的条件下,让四足机器人实现在复杂地形上自由流畅地行走呢?

近期,来自美国加州大学圣地亚哥分校和麻省理工学院的研究团队,开发了一个可以提高机器人 3D 感知能力的模型,能够支配四足机器人在各种困难地形场景下完成自动化行走,比如爬楼梯、踩石头、在树林中走路等。

如视频所示,该四足机器人的额头上装有前置的深度摄像头,该摄像头向下倾斜的角度,可以帮助该机器人前面的两足,根据所看到的前方场景和脚下地形做出正确的行动决策。但其后面的两足必须先记住前面看过的内容,才能确保在经过时踩在正确的位置上。

所以,这中间存在一个重要的问题,即需要一个短期的 3D 环境记忆体,能够使得机器人的四足都对三维环境有良好的感知和模拟。

为此,该团队构建了一种神经体积记忆(Neural Volumetric Memory,NVM)架构,可以先借助自监督方法对视频帧中的三维特征进行学习,再用几何变换把这些三维特征投影到同一个空间下面,最后通过模型将所有的特征信息融合在一起,让机器人对它所处的 3D 环境建立起短期记忆。

其中,需要说明的是,将上述带有特征的全部视觉信息综合在一起,可以帮助四足机器人记住其看到的内容,以及足部之前做过的动作,并利用这些记忆指导它下一步行动。这也表明,NVM 能为机器人执行决策提供可靠的 3D 结构信息,并为足式机器人利用视觉进行观察开辟新的可能性。

2023 年 3 月,相关论文以《用于视觉运动控制的神经体积记忆》(Neural Volumetric Memory for Visual Locomotion Control)为题发表在CVPR上,并被选为Highlight论文[1]。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨相关论文(来源:arXiv)

加州大学圣地亚哥分校博士研究生杨睿涵为该论文的第一作者,加州大学圣地亚哥分校助理教授王小龙担任论文的通讯作者。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨王小龙(来源:王小龙)

据介绍,该研究始于 2022 年 1 月。在当时的条件下,该团队先在模拟器环境下进行训练,再转至机器人上进行部署和测试。NVM 模块可以令四足机器人在模拟环境和真实世界中穿越复杂地形,并获得更好的模拟-真实泛化结果。

但是,由于模拟器和机器人在物理和视觉方面都存在一些差距,因此需要克服许多有难度的工程问题。此外,从模拟器中制定任务,以及做强化学习训练所需的代码,也需要该团队自行开发。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨实际部署(来源:arXiv)

据了解,这项成果建立在该团队之前的一项研究上,此前,该团队使用强化学习和基于 Transformer 的模型,将本体感受和视觉信息相结合,使得四足机器人能够避开障碍物,在不平整的地面上行走和奔跑 [2]。

“我们目前这项研究是在不同帧上抽取三维特征,把它们放到同一个三维空间下进行合并,而之前的那项研究仅仅将不同帧直接合并起来,当做一个视频放入卷积神经网络中,没有做太多三维理解。”谈及本项成果取得的进展,王小龙表示,“并且,之前机器人能完成的任务比较简单,不能实现爬楼梯或踩木桩这种比较困难的任务。”

不过,该团队也表示,他们目前开发的模型还存在一些局限性。首先,不能引导四足机器人到达指定的目的地;其次,完成部署后,机器人只能简单地走一条直线,如果看到障碍物,会通过另一条直线避开;此外,机器人还不能精确控制其去向。

从应用层面上看,相较于安装轮子才能走路的机器人,四足机器人的通用性更强。比如,其可以用于应急救援领域,执行受困人员搜救、废墟清理等任务;用于下水管道探测等。

后续,该团队不仅计划开发更多用于规划机器人的技术,还打算在四足机器人上增加机械臂,来执行抓取、开门等任务;同时,他们也想让机器人实现更多创意性的技能,诸如跳跃、踢球等。

参考资料:

1. R., Yang, G., Yang, X., Wang. Neural Volumetric Memory for Visual Locomotion Control. arXiv(2023). https://doi.org/10.48550/arXiv.2304.01201

2. R., Yang, M., Zhang, N., Hansen. et al.Learning Vision-Guided Quadrupedal LocomotionEnd-to-End with Cross-Modal Transformers. arXiv(2022). https://doi.org/10.48550/arXiv.2107.03996

https://techxplore.com/news/2023-06-four-legged-robot-traverses-tricky-terrains.html

https://rchalyang.github.io/NVM/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-12 18:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

全球顶级AI科学家李飞飞领衔的具身智能项目 到底长啥样?
...团队于近日发布了具身智能的最新研究成果,大模型接入机器人,可将复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。该项目名为“
2023-07-11 22:00:00
...智能医工产业园在北京丰台正式启动。产业园将聚焦医疗机器人、智能诊疗等领域,打造智能医工产业集群。近年来,医工融合成为医药健康产业的重要发展趋势。为因地制宜培育新质生产力,丰台
2024-06-18 12:15:00
...种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)
2024-06-12 18:15:00
AI科学家创业做扫地机,让机器人“长脑子”,这个赛道火了
机器人贴边清理卫生、定向拾起易拉罐,甚至能听懂人类世界中的流行文化梗、在你面前跳起“海藻舞”……这些科幻片中的场景,正在被AI大模型加速带到现实世界中。在AI大模型出现以前,机器
2024-07-01 18:05:00
最新美国国家人工智能科学院院士介绍
...和专家,他们在机器学习、自然语言处理、计算机视觉、机器人技术、智能系统等方向具有深厚的学术背景和丰富的实践经验。这些成员通过参与科学院的研究项目、撰写学术论文、举办学术会议和
2024-03-24 08:39:00
科学家竞相破解大型语言模型背后的谜团
...么、如何做以及为什么这样做等谜团。谈话疗法由于聊天机器人可以进行对话,一些研究人员就让模型自我解释,以了解其工作原理。这种方法类似于心理学中使用的“谈话疗法”。德国斯图加特大
2024-05-18 02:42:00
如何让“机器不学习”?学会“遗忘”将使新一代AI更出色
由于人们担心人工智能(AI)驱动的聊天机器人可能会泄露私人数据,计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难,但“机器不学习”的解决方案已经开始出现。这项工作除了能
2024-06-14 11:54:00
对话千寻智能高阳:科学家创业不太“靠谱”,但创业就像一场游戏
...WAIC(世界人工智能大会),还是本周要开幕的WRC(世界机器人大会),如何在展会上识别一个机器人的真正实力?具身智能公司“千寻智能”的联合创始人高阳,提供了这样几个tips
2025-08-09 08:22:00
科学家制成迄今最轻快全功能机器人:以昆虫为模型 轻至8毫克
...立伟美国华盛顿州立大学的科学家们近日研发出两款微型机器人,一款名为“Mini Bug”,体重仅为55毫克,能够以每秒6毫米的速度移动
2024-01-23 09:58:00
更多关于科技的资讯:
高德扫街榜100天全新升级:从美食到吃喝玩乐,全球首次实现飞行实景探店
1月7日,上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个“飞行街景”,实现从街景一路俯瞰至店内实景
2026-01-07 14:08:00
税赋能肇庆新能源汽配集群蓄力成长
在粤港澳大湾区汽车产业集群迅猛发展的浪潮中,肇庆市鼎湖区依托区位优势和产业基础,新能源汽车零配件产业集群加速成型。从专注新能源汽车电池安全材料的国家级专精特新“小巨人”
2026-01-07 13:46:00
高德扫街榜100天重磅升级:全球首推飞行实景探店,免费向100万烟火小店开放
1月7日,上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个“飞行街景”,实现从街景一路俯瞰至店内实景
2026-01-07 11:26:00
让光谱仪变小变强:清华大学团队从波粒二象性找到答案
近日,清华大学电子系鲍捷教授团队在材料科学领域国际知名期刊《Nano Research》发表题为《The Wave-Particle Duality of Light Manif
2026-01-07 08:54:00
近期,荣程智运科技(天津)有限公司(以下简称“荣程智运”)自主研发的“基于图像识别的非格式化磅单智能转换方法及系统”获得国家发明专利授权
2026-01-07 09:04:00
一颗“善变”的石头|了不起的河南智造③
【编者按】当厚重中原遇上智慧创新,会擦出怎样的火花?黄河之畔,钢铁与芯片共舞,机械臂与大数据齐鸣,一场“智造交响曲 ”正在上演
2026-01-07 09:06:00
三河市燕郊首届机器人科技展开幕
河北新闻网讯(刘伟)1月2日,燕郊首届机器人科技展在三河市燕郊天洋广场盛大开幕。活动为期两天,由三河市委宣传部、三河市科协主办
2026-01-07 09:47:00
科技赋能反诈 珍爱网筑牢婚恋交友安全屏障
在互联网高速发展的当下,信息便利与安全风险并存,个人信息泄露、网络诈骗等问题给婚恋交友带来诸多隐患。作为深耕行业二十年的婚恋服务领军企业
2026-01-07 08:54:00
昨日,A股继续发动攻势,其中上证指数盘中突破2025年11月中旬4034点的阶段性高点,收在全天最高点4083.67点
2026-01-07 08:06:00
中新经纬1月6日电 6日晚,小米公司发言人官方微博公布了团队与相关KOL接触一事的处罚结果。全文如下:昨天关于团队与相关KOL接触一事
2026-01-07 08:08:00
杭州日报讯 创新往往来自年轻人。“我要特别致敬青年人,青年人始终站在时代前列,他们代表着社会前进的方向。”1月3日,杭州浙江大学校友会会长
2026-01-07 07:05:00
■程璐摘要:在高中英语学习中,词汇掌握质量直接影响阅读理解与表达能力。传统词汇教学多停留在机械记忆层面,学生难以形成稳定且可迁移的词汇表征
2026-01-07 04:52:00
江西如何跑稳“谷子经济”千亿赛道(图)
“‘谷子’不仅是Goods的谐音,对于我们来说,也是一种精神食粮。”刚从二手集市收摊的高中生小甜(化名)对“吃谷”这件事有着自己的理解
2026-01-07 04:52:00
喜旺春节礼盒上市!把年味与福气,一键打包带回家
辞暮尔尔,烟火年年。当街头的红灯笼渐渐挂起,当归家的车票开始抢订,藏在心底的年味也愈发浓烈。年,是团圆的相聚,是味蕾的盛宴
2026-01-07 05:00:00
烟台高新区:中关村烟台协同创新中心举办航空航天专场—烟台优质企业北京场景应用对接会
胶东在线1月5日讯(通讯员 郭健 实习编辑 单煜媛)近日,中关村·烟台协同创新中心联合烟台绿丞先进材料创新服务中心在北京举办烟台优质企业场景应用(航空航天专场)对接会
2026-01-07 05:00:00