• 我的订阅
  • 科技

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

类别:科技 发布时间:2023-09-12 14:20:00 来源:DeepTech深科技

借助机器人的本体感觉对足式运动进行研究已有数十年。在以往的研究手段中,研究人员往往采用基于模型的方法开发神经网络控制器。但是,这类方法无法在那些现实世界里没有见过的环境中得到应用。

近年来,为了获得更好的泛化性和鲁棒性,研究者们开始采用无模型强化学习,在模拟中训练控制器,然后将学习到的策略直接转移到真实的机器人上。

那么,如何在无需遥控器操控的条件下,让四足机器人实现在复杂地形上自由流畅地行走呢?

近期,来自美国加州大学圣地亚哥分校和麻省理工学院的研究团队,开发了一个可以提高机器人 3D 感知能力的模型,能够支配四足机器人在各种困难地形场景下完成自动化行走,比如爬楼梯、踩石头、在树林中走路等。

如视频所示,该四足机器人的额头上装有前置的深度摄像头,该摄像头向下倾斜的角度,可以帮助该机器人前面的两足,根据所看到的前方场景和脚下地形做出正确的行动决策。但其后面的两足必须先记住前面看过的内容,才能确保在经过时踩在正确的位置上。

所以,这中间存在一个重要的问题,即需要一个短期的 3D 环境记忆体,能够使得机器人的四足都对三维环境有良好的感知和模拟。

为此,该团队构建了一种神经体积记忆(Neural Volumetric Memory,NVM)架构,可以先借助自监督方法对视频帧中的三维特征进行学习,再用几何变换把这些三维特征投影到同一个空间下面,最后通过模型将所有的特征信息融合在一起,让机器人对它所处的 3D 环境建立起短期记忆。

其中,需要说明的是,将上述带有特征的全部视觉信息综合在一起,可以帮助四足机器人记住其看到的内容,以及足部之前做过的动作,并利用这些记忆指导它下一步行动。这也表明,NVM 能为机器人执行决策提供可靠的 3D 结构信息,并为足式机器人利用视觉进行观察开辟新的可能性。

2023 年 3 月,相关论文以《用于视觉运动控制的神经体积记忆》(Neural Volumetric Memory for Visual Locomotion Control)为题发表在CVPR上,并被选为Highlight论文[1]。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨相关论文(来源:arXiv)

加州大学圣地亚哥分校博士研究生杨睿涵为该论文的第一作者,加州大学圣地亚哥分校助理教授王小龙担任论文的通讯作者。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨王小龙(来源:王小龙)

据介绍,该研究始于 2022 年 1 月。在当时的条件下,该团队先在模拟器环境下进行训练,再转至机器人上进行部署和测试。NVM 模块可以令四足机器人在模拟环境和真实世界中穿越复杂地形,并获得更好的模拟-真实泛化结果。

但是,由于模拟器和机器人在物理和视觉方面都存在一些差距,因此需要克服许多有难度的工程问题。此外,从模拟器中制定任务,以及做强化学习训练所需的代码,也需要该团队自行开发。

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

图丨实际部署(来源:arXiv)

据了解,这项成果建立在该团队之前的一项研究上,此前,该团队使用强化学习和基于 Transformer 的模型,将本体感受和视觉信息相结合,使得四足机器人能够避开障碍物,在不平整的地面上行走和奔跑 [2]。

“我们目前这项研究是在不同帧上抽取三维特征,把它们放到同一个三维空间下进行合并,而之前的那项研究仅仅将不同帧直接合并起来,当做一个视频放入卷积神经网络中,没有做太多三维理解。”谈及本项成果取得的进展,王小龙表示,“并且,之前机器人能完成的任务比较简单,不能实现爬楼梯或踩木桩这种比较困难的任务。”

不过,该团队也表示,他们目前开发的模型还存在一些局限性。首先,不能引导四足机器人到达指定的目的地;其次,完成部署后,机器人只能简单地走一条直线,如果看到障碍物,会通过另一条直线避开;此外,机器人还不能精确控制其去向。

从应用层面上看,相较于安装轮子才能走路的机器人,四足机器人的通用性更强。比如,其可以用于应急救援领域,执行受困人员搜救、废墟清理等任务;用于下水管道探测等。

后续,该团队不仅计划开发更多用于规划机器人的技术,还打算在四足机器人上增加机械臂,来执行抓取、开门等任务;同时,他们也想让机器人实现更多创意性的技能,诸如跳跃、踢球等。

参考资料:

1. R., Yang, G., Yang, X., Wang. Neural Volumetric Memory for Visual Locomotion Control. arXiv(2023). https://doi.org/10.48550/arXiv.2304.01201

2. R., Yang, M., Zhang, N., Hansen. et al.Learning Vision-Guided Quadrupedal LocomotionEnd-to-End with Cross-Modal Transformers. arXiv(2022). https://doi.org/10.48550/arXiv.2107.03996

https://techxplore.com/news/2023-06-four-legged-robot-traverses-tricky-terrains.html

https://rchalyang.github.io/NVM/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-12 18:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

全球顶级AI科学家李飞飞领衔的具身智能项目 到底长啥样?
...团队于近日发布了具身智能的最新研究成果,大模型接入机器人,可将复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。该项目名为“
2023-07-11 22:00:00
...智能医工产业园在北京丰台正式启动。产业园将聚焦医疗机器人、智能诊疗等领域,打造智能医工产业集群。近年来,医工融合成为医药健康产业的重要发展趋势。为因地制宜培育新质生产力,丰台
2024-06-18 12:15:00
...种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)
2024-06-12 18:15:00
AI科学家创业做扫地机,让机器人“长脑子”,这个赛道火了
机器人贴边清理卫生、定向拾起易拉罐,甚至能听懂人类世界中的流行文化梗、在你面前跳起“海藻舞”……这些科幻片中的场景,正在被AI大模型加速带到现实世界中。在AI大模型出现以前,机器
2024-07-01 18:05:00
最新美国国家人工智能科学院院士介绍
...和专家,他们在机器学习、自然语言处理、计算机视觉、机器人技术、智能系统等方向具有深厚的学术背景和丰富的实践经验。这些成员通过参与科学院的研究项目、撰写学术论文、举办学术会议和
2024-03-24 08:39:00
科学家竞相破解大型语言模型背后的谜团
...么、如何做以及为什么这样做等谜团。谈话疗法由于聊天机器人可以进行对话,一些研究人员就让模型自我解释,以了解其工作原理。这种方法类似于心理学中使用的“谈话疗法”。德国斯图加特大
2024-05-18 02:42:00
如何让“机器不学习”?学会“遗忘”将使新一代AI更出色
由于人们担心人工智能(AI)驱动的聊天机器人可能会泄露私人数据,计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难,但“机器不学习”的解决方案已经开始出现。这项工作除了能
2024-06-14 11:54:00
对话千寻智能高阳:科学家创业不太“靠谱”,但创业就像一场游戏
...WAIC(世界人工智能大会),还是本周要开幕的WRC(世界机器人大会),如何在展会上识别一个机器人的真正实力?具身智能公司“千寻智能”的联合创始人高阳,提供了这样几个tips
2025-08-09 08:22:00
科学家制成迄今最轻快全功能机器人:以昆虫为模型 轻至8毫克
...立伟美国华盛顿州立大学的科学家们近日研发出两款微型机器人,一款名为“Mini Bug”,体重仅为55毫克,能够以每秒6毫米的速度移动
2024-01-23 09:58:00
更多关于科技的资讯:
当患者或患者家属去医院的病案室复印住院病历时,会发现住院病案首页出院诊断表格上有一栏疾病编码,疾病编码栏下填有一串串字母数字组成的编码
2026-01-17 04:40:00
■李伯宸 四川传媒学院摘要:随着时代的发展和科学技术的进步,数字媒体艺术与人工智能技术已经为人类的生活方式带来了深刻的变化
2026-01-17 04:40:00
■刘舒浅 对外经济贸易大学管理学院摘要:大数据技术对传统统计工作产生了重要的影响。将大数据与传统统计方法相融合,是统计工作实现规范化
2026-01-17 04:40:00
车联天下与AMD达成战略合作,共推智能网联汽车技术升级
全球汽车产业正加速向电动化、智能化和网联化转型,智能驾驶和车载娱乐已成为未来出行体验的重要驱动力。AI和高性能计算技术在车辆感知
2026-01-16 21:22:00
百奥赛图(688796)以基因编辑技术起家,是一家创新药临床前CRO及生物技术公司,专门为创新药企业提供抗体药物发现及临床前研发服务
2026-01-16 22:48:00
中新经纬1月16日电 16日下午,市场监管总局召开食品安全专题新闻发布会。市场监管总局食品协调司副司长母兰在发布会上称
2026-01-16 21:34:00
在生成式AI重塑信息检索范式的当下,GEO(生成式引擎优化)已从营销小众赛道跃升为企业数字化转型的核心增长引擎。据艾瑞咨询《2026 GEO行业报告》显示
2026-01-16 21:23:00
中国优秀AI企业2026年展望:AI技术迭代深化引领商业化规模化落地 全球AI产业进入技术深耕与商业化兑现双轮加速期,中国优秀AI企业迎来价值释放关键窗口
2026-01-16 17:14:00
8个省级高质量数据集、324家省级“晨星工厂” 临沂扎实筑牢“人工智能+”发展根基
鲁网1月16日讯 (记者 李文静)数据是赋能人工智能训练的原材料。1月16日上午,临沂市人民政府新闻办公室召开新闻发布会
2026-01-16 17:18:00
中新经纬1月16日电 题:中国电影IP的长期主义,还缺什么?作者 张志鹏 中国广告协会文创与IP专业委员会副主任近日,玩具制造商桑尼森迪正式递表港交所
2026-01-16 17:22:00
贾国龙最新发声:今晚10点 将就罗永浩对西贝的重大污蔑诽谤全面回应
华商网讯 1月16日,西贝贾国龙发文称,将就罗永浩对西贝的重大污蔑诽谤一一全面回应。据了解,此前,1月16日,罗永浩再次发长文回应西贝贾国龙近日言论
2026-01-16 18:46:00
第七届皖新传媒读者节全省启动
大皖新闻讯 1月17日起,以“阅见万象 奔向前程”为主题的第七届皖新传媒读者节在全省新华书店市、县门店正式拉开帷幕,活动将持续至2月1日
2026-01-16 18:55:00
双主题活动+三重深度体验,金鸡湖教育集团科技节展现赋能成长新路径
江南时报讯 当知识课堂与前沿科技相遇,当学校携手行业大咖跨界联动,金鸡湖教育集团的科技节彻底点燃了整个校园。两大主题活动
2026-01-16 17:06:00
刘典(学者)2025年春天,《杭州模式:DeepSeek与中国算谷》出版了。对我而言,一本书写完了,从来不是结束,而是带着这些思考
2026-01-16 16:56:00
时间枝头 生活向新
这些关于“具体生活”的探索与坚守,既是过往一年的珍贵注脚,更铺就了通往新岁的温暖底色。 吴卓平回顾过去这一年,杭州的文化
2026-01-16 16:56:00