• 我的订阅
  • 科技

北大提出首个通用指令导航大模型系统 | CoRL 24

类别:科技 发布时间:2024-09-13 13:38:00 来源:量子位

想象一下当你躺在沙发上,只需要不假思索地说出指令,机器人就能帮你干活,是不是听起来就十分惬意?

如今这种科幻电影中的场景正在变为现实,来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。

不论是寻找物体,走到指定位置,还是满足抽象的人类需求,只要你说出指令,InstructNav都能帮你实现。

北大提出首个通用指令导航大模型系统 | CoRL 24

目前该工作已经被CoRL(Conference on Robot Learning)2024会议录用,文章可在Arxiv浏览,代码也即将在近期开源。

北大提出首个通用指令导航大模型系统 | CoRL 24

大模型如何统一具身指令导航规划?

不同的导航任务要求截然不同的能力,经典的物体导目标航任务需要理解房间结构和物体之间的联系,视觉语言导航任务侧重于严谨地遵循指令,而新兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。

先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的具身导航模型都无法满足这样的实际需求,因此实现通用指令导航对于机器人在现实世界的应用充满价值。

为了实现这一目标,作者首先提出动态导航链路(Dynamic Chain-of-Navigation)这一全新的导航规划范式,将不同类型的导航指令统一为“导航动作 1 - 标志物1 -> 导航动作 2 - 标志物 2 … ”的标准形式。

InstructNav利用大语言模型在任务规划和常识推理上的卓越能力,根据原始指令规划导航链路。

在导航过程中,InstructNav会根据最新观测到的场景物体不断更新导航链路,引导机器人对于环境进行有效探索。

例如,当指令要求“寻找沙发”时,动态导航链路会被更新为“探索 - 电视”附近区域,因为电视旁边最可能存在沙发。

北大提出首个通用指令导航大模型系统 | CoRL 24

构建大模型推理到价值地图的映射

以上由大模型规划的动态导航链路和控制机器人底层动作之间仍然存在较大差异。

为了引导机器人根据动态导航链路行动,作者提出将大模型的规划结果映射到多源价值地图(Multi-sourced Value Maps)上,这些价值地图包括:

    动作价值地图(Action Value Map):赋予待执行动作对应的区域更高可导航价值。 语义价值地图(Semantic Value Map):赋予标志物对应的区域更高可导航价值。 直觉价值地图(Intuition Value Map):利用多模态大模型判断全景图中最适合移动的区域,并赋予更高可导航价值。 轨迹价值地图(Trajectory Value Map):赋予远离现有轨迹的区域更高的可导航价值。

北大提出首个通用指令导航大模型系统 | CoRL 24

通过对多源价值地图相加求和即可得到决策价值地图(Decision-making Value Map)。

在决策价值地图上选取最高价值点作为下一途径点,然后利用点到点的路径规划算法即可实现对于机器人底层移动的控制。

多个零样本导航任务新SOTA

作者在经典的物体目标导航任务,视觉语言导航任务以及最新的需求导航任务上开展标准化评测。

从以下表格中可以观察到,InstructNav首次实现连续环境下零样本的视觉语言导航,并在零样本的物体目标导航和需求驱动导航任务上全面超越所有的现有方法,获得最高成功率。

北大提出首个通用指令导航大模型系统 | CoRL 24

文章链接:https://arxiv.org/pdf/2406.04882项目链接:https://sites.google.com/view/instructnav代码链接:https://github.com/LYX0501/InstructNav

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-13 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

24小时值守的药房拣货机器人,融资12亿
...,采用轮式双臂构型,拥有可以感知通用环境和理解用户指令的多模态大脑大模型,成功率超过95%的跨形状材质的泛化抓取技术。银河通用在世界机器人大会上的展台机器人拥有能够理解用户指
2024-11-19 15:04:00
石景山尖端科技创新成果集中亮相北京科技周
...绍,目前,仿生臂应用在居家康养中,例如可以听从语音指令,将脏衣服投放到洗衣机中并进行洗衣操作。此外,仿生臂还应用在美团无人药店和京东物流的分拣中,节省了大量人力。工业互联网产
2024-05-28 00:08:00
机器人志愿者,多语种解说系统:北大“黑科技”亮相杭州亚运
...—9月27日,澎湃新闻(www.thepaper.cn)从北京大学了解到,北大计算机学院的最新“黑科技”在杭州亚运会期间亮相
2023-09-28 14:22:00
智能信控助力城市缓堵保畅
...安交警的智能信控中心,解码西安“交通大脑”。“数据指令”为缓堵保畅提供科学方案每天上下班高峰是交警最忙的时候,在市公安局交警支队的信号控制中心里,20多位信控工程师和值班交警
2023-06-16 04:57:00
清华学霸出手!AI大模型精准“导航”高考志愿,个性化填报成新宠
...以其远超通用平台的精准个性化推荐受到热捧!告别复杂指令,拥抱精准匹配,直击志愿核心痛点与通用AI工具不同,“在问志愿星”专为高考志愿场景深度定制,操作极简,无需复杂指令,却能
2025-06-25 15:06:00
从智能中枢到超拟人助手:三星Galaxy S25系列揭示手机未来形态
...即所解"的交互方式,彻底改变了传统智能手机单向接收指令的单一工作模式。一语多意图:只要一声令下就能跨App完成多项复杂任务得益于Samsung One UI 7系统加持
2025-02-12 12:19:00
北大荒集团:智慧服务让春耕生产更便利
...远程掌握苗情。“这套系统还能根据数据自动对大棚发出指令,实时自动调控温湿度和水肥一体作业,精准控制秧苗生长。”王伟说,这样的大棚在洪河农场有限公司有143栋,可以避免普通育秧
2024-05-09 00:40:00
本文转自:黑龙江日报北大荒集团创业农场智慧农机北斗导航精准插秧连日来,在北大荒集团创业农场,无人驾驶的智慧插秧机随处可见,插秧机精准走位、自动栽插,身后的秧苗整整齐齐,稳稳挺立在
2024-05-13 06:01:00
VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!
...身。这当然很棒,但当我们想给机器人传达更复杂的动作指令时,在手柄上相应的操作就繁琐了很多。能不能开发出一种更易用、直观的人机交互方法,能让我们更轻松地发送指令给机器人呢?与其
2023-08-03 18:00:00
更多关于科技的资讯:
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00
■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系,着力打通数据壁垒与业务断点,促进产业链各环节融通发展■建立功能完善
2025-10-31 09:05:00
在数字化、网络化、智能化的当下,图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”?近日,第五届长三角公共图书馆发展论坛在上海举行
2025-10-31 09:05:00
Mutual妙趣艺:全球战略+资源整合,打造文娱IP数字资产化标杆
Mutual妙趣艺于2020年成立于美国加州,专注于文娱IP(知识产权)数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”
2025-10-31 10:57:00
鲁网10月31日讯近日,“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上,工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”
2025-10-31 11:43:00
人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,广西聚焦国家所需、广西所能、东盟所盼,正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径
2025-10-31 11:46:00
aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类供应商——以中国智造共铸无界对话的全球盛事
上海,2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛(WCGC)全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行
2025-10-31 11:52:00
让检测全面拥抱AI!科学指南针2025产品服务发布会举行
让检测全面拥抱AI!10月30日,科学指南针2025年度产品服务发布会在杭州举办,来自高校院所、企业、分析测试中心等多方行业代表到场参会
2025-10-31 11:52:00
培育钻定制哪个品牌好?2025最新测评出炉,国产珠宝高性价比领跑榜单
曾几何时,钻石承载着“钻石恒久远,一颗永流传”的爱情神话,而天然钻石的稀缺性更被赋予了极高的市场价值。然而,随着实验室培育钻石技术的突破性进展
2025-10-31 12:14:00
在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期,平台竞争力已不再局限于单一的预订功能,而是延伸至合规风控
2025-10-31 12:16:00
拓竹荣膺《时代》最佳发明,3D打印技术步入主流创新支撑体系
近期,《时代》周刊公布2025年度最佳发明榜单,揭示一个耐人寻味的现象:在300项突破性发明中,仅有4项被明确标注为3D打印创新
2025-10-31 12:19:00