• 我的订阅
  • 科技

北大提出首个通用指令导航大模型系统 | CoRL 24

类别:科技 发布时间:2024-09-13 13:38:00 来源:量子位

想象一下当你躺在沙发上,只需要不假思索地说出指令,机器人就能帮你干活,是不是听起来就十分惬意?

如今这种科幻电影中的场景正在变为现实,来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。

不论是寻找物体,走到指定位置,还是满足抽象的人类需求,只要你说出指令,InstructNav都能帮你实现。

北大提出首个通用指令导航大模型系统 | CoRL 24

目前该工作已经被CoRL(Conference on Robot Learning)2024会议录用,文章可在Arxiv浏览,代码也即将在近期开源。

北大提出首个通用指令导航大模型系统 | CoRL 24

大模型如何统一具身指令导航规划?

不同的导航任务要求截然不同的能力,经典的物体导目标航任务需要理解房间结构和物体之间的联系,视觉语言导航任务侧重于严谨地遵循指令,而新兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。

先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的具身导航模型都无法满足这样的实际需求,因此实现通用指令导航对于机器人在现实世界的应用充满价值。

为了实现这一目标,作者首先提出动态导航链路(Dynamic Chain-of-Navigation)这一全新的导航规划范式,将不同类型的导航指令统一为“导航动作 1 - 标志物1 -> 导航动作 2 - 标志物 2 … ”的标准形式。

InstructNav利用大语言模型在任务规划和常识推理上的卓越能力,根据原始指令规划导航链路。

在导航过程中,InstructNav会根据最新观测到的场景物体不断更新导航链路,引导机器人对于环境进行有效探索。

例如,当指令要求“寻找沙发”时,动态导航链路会被更新为“探索 - 电视”附近区域,因为电视旁边最可能存在沙发。

北大提出首个通用指令导航大模型系统 | CoRL 24

构建大模型推理到价值地图的映射

以上由大模型规划的动态导航链路和控制机器人底层动作之间仍然存在较大差异。

为了引导机器人根据动态导航链路行动,作者提出将大模型的规划结果映射到多源价值地图(Multi-sourced Value Maps)上,这些价值地图包括:

    动作价值地图(Action Value Map):赋予待执行动作对应的区域更高可导航价值。 语义价值地图(Semantic Value Map):赋予标志物对应的区域更高可导航价值。 直觉价值地图(Intuition Value Map):利用多模态大模型判断全景图中最适合移动的区域,并赋予更高可导航价值。 轨迹价值地图(Trajectory Value Map):赋予远离现有轨迹的区域更高的可导航价值。

北大提出首个通用指令导航大模型系统 | CoRL 24

通过对多源价值地图相加求和即可得到决策价值地图(Decision-making Value Map)。

在决策价值地图上选取最高价值点作为下一途径点,然后利用点到点的路径规划算法即可实现对于机器人底层移动的控制。

多个零样本导航任务新SOTA

作者在经典的物体目标导航任务,视觉语言导航任务以及最新的需求导航任务上开展标准化评测。

从以下表格中可以观察到,InstructNav首次实现连续环境下零样本的视觉语言导航,并在零样本的物体目标导航和需求驱动导航任务上全面超越所有的现有方法,获得最高成功率。

北大提出首个通用指令导航大模型系统 | CoRL 24

文章链接:https://arxiv.org/pdf/2406.04882项目链接:https://sites.google.com/view/instructnav代码链接:https://github.com/LYX0501/InstructNav

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-13 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

24小时值守的药房拣货机器人,融资12亿
...,采用轮式双臂构型,拥有可以感知通用环境和理解用户指令的多模态大脑大模型,成功率超过95%的跨形状材质的泛化抓取技术。银河通用在世界机器人大会上的展台机器人拥有能够理解用户指
2024-11-19 15:04:00
石景山尖端科技创新成果集中亮相北京科技周
...绍,目前,仿生臂应用在居家康养中,例如可以听从语音指令,将脏衣服投放到洗衣机中并进行洗衣操作。此外,仿生臂还应用在美团无人药店和京东物流的分拣中,节省了大量人力。工业互联网产
2024-05-28 00:08:00
机器人志愿者,多语种解说系统:北大“黑科技”亮相杭州亚运
...—9月27日,澎湃新闻(www.thepaper.cn)从北京大学了解到,北大计算机学院的最新“黑科技”在杭州亚运会期间亮相
2023-09-28 14:22:00
智能信控助力城市缓堵保畅
...安交警的智能信控中心,解码西安“交通大脑”。“数据指令”为缓堵保畅提供科学方案每天上下班高峰是交警最忙的时候,在市公安局交警支队的信号控制中心里,20多位信控工程师和值班交警
2023-06-16 04:57:00
清华学霸出手!AI大模型精准“导航”高考志愿,个性化填报成新宠
...以其远超通用平台的精准个性化推荐受到热捧!告别复杂指令,拥抱精准匹配,直击志愿核心痛点与通用AI工具不同,“在问志愿星”专为高考志愿场景深度定制,操作极简,无需复杂指令,却能
2025-06-25 15:06:00
从智能中枢到超拟人助手:三星Galaxy S25系列揭示手机未来形态
...即所解"的交互方式,彻底改变了传统智能手机单向接收指令的单一工作模式。一语多意图:只要一声令下就能跨App完成多项复杂任务得益于Samsung One UI 7系统加持
2025-02-12 12:19:00
北大荒集团:智慧服务让春耕生产更便利
...远程掌握苗情。“这套系统还能根据数据自动对大棚发出指令,实时自动调控温湿度和水肥一体作业,精准控制秧苗生长。”王伟说,这样的大棚在洪河农场有限公司有143栋,可以避免普通育秧
2024-05-09 00:40:00
本文转自:黑龙江日报北大荒集团创业农场智慧农机北斗导航精准插秧连日来,在北大荒集团创业农场,无人驾驶的智慧插秧机随处可见,插秧机精准走位、自动栽插,身后的秧苗整整齐齐,稳稳挺立在
2024-05-13 06:01:00
VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!
...身。这当然很棒,但当我们想给机器人传达更复杂的动作指令时,在手柄上相应的操作就繁琐了很多。能不能开发出一种更易用、直观的人机交互方法,能让我们更轻松地发送指令给机器人呢?与其
2023-08-03 18:00:00
更多关于科技的资讯:
“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注,这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮,小众街巷因一条短视频迎来客流井喷
2025-11-03 12:25:00
乘AI之势,筑电子产业之基,CPCA Show Plus 2025 圆满闭幕,2026再相见!
2025年10月28日-30日,电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(以下简称:CPCA Show Plus)在深圳国际会展中心(宝安)盛大举办
2025-11-03 12:43:00
培育钻值得购买吗?超全选购攻略一篇搞定,附头部品牌深度测评
当越来越多的年轻人开始琢磨“如何高性价比的结个婚”,培育钻石凭借着价格优势、环保理念,正成为暗潮涌动的钻戒市场的新宠。据统计
2025-11-03 12:45:00
未来,AI有望打造口感逼真的植物蛋白
大河网讯 “人工智能(AI)正以前所未有的速度加速食品创新,它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方,还能辅助设计个性化营养食品
2025-11-03 13:10:00
2025 年,Facebook 依托 Meta 生态的 29.8 亿全球月活用户(Statista 数据),仍是企业海外拓客的关键阵地
2025-11-03 12:46:00
彰显国际范科技范 第十七届厦门国际动漫节圆满落幕
角色扮演者在金海豚动漫游戏嘉年华现场打卡。厦门游戏企业展台带来多样互动活动。游路演活动现场,企业展开对接。(动漫节组委会 供图) 厦门网讯(文/厦门日报记者 林露虹 通讯员 洪慧敏 图/厦门日报记者 林铭鸿 除署名外)昨日傍晚
2025-11-03 08:55:00
报告:亲身体验“在地风物”成年轻人出行新理由
近日,中国旅游研究院(文化和旅游部数据中心)与马蜂窝联合召开“旅游目的地探索系列报告发布会”,发布该系列最新研究成果——《中国风物报告》
2025-11-03 09:28:00
几何之厦落子广州白云机场T3,以“文化坪效”重塑机场商业价值
(2025年10月30日,广州电) 今日,广州白云国际机场T3航站楼正式通航,与这座未来年客流量超千万级航空枢纽一同启幕的
2025-11-03 09:59:00
固安:“共享工厂”赋能特色产业集群高质量发展
河北新闻网讯(万倩、王智钢)走进汉旗电子科技(固安)有限公司的生产车间,企业新升级的智能化生产线正在高效运转。这里不仅是企业自身的生产基地
2025-11-03 10:00:00
梦启未来!2025年“兴火·燎原”创新马拉松公开赛火热报名中
创新驱动发展澎湃潮涌,“数字中国”建设如火如荼。年年相约,再启新程,2025年“兴火·燎原”创新马拉松公开赛正式开放报名
2025-11-03 10:29:00
阿宽食品以品类创新引领发展:从红油面皮到土豆泥泥面、魔芋系列
10月27日至28日,四川省预制食品产业高质量发展推进会在眉山市召开。当天,阿宽食品作为代表企业设展,重点展示了包括红油面皮
2025-11-03 10:29:00
浪潮计算机生态发展大会圆满举办
10月31日,以“潮涌水城 链动未来”为主题的浪潮计算机生态发展大会圆满举办。浪潮集团党委副书记、总经理刘继永,聊城市委副书记
2025-11-03 10:56:00
工信部公布产才融合应用场景19个典型案例 软件谷入选国家级名单,南京唯一南报网讯(通讯员林园园记者于洁尘)10月28日
2025-11-03 07:37:00
平价社区超市“跑马圈地”,半年连开20家 超盒算NB在南京一天开4店南报网讯(记者张希)10月31日,盒马旗下硬折扣超市品牌超盒算NB在南京4店同开
2025-11-03 07:38:00
今日关注数字21.9%关键词新动能前三季度,全市基础设施投资同比增长4.2%,其中本年新开工项目投资同比增长21.9%
2025-11-03 07:38:00