• 我的订阅
  • 科技

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

类别:科技 发布时间:2023-08-03 18:00:00 来源:CSDN

作者 | 曾浩辰 责编 | 袁滚滚

出品 | CSDN(ID:CSDNnews)

“机器人技术将是我们在人工智能领域征服的最后一道护城河。一个给机器人使用的GPT模型,它的应用程序接口是什么样的?”

——英伟达资深 AI 科学家 Jim Fan,师从李飞飞。

工程师们一直在试图搭建更智能、可靠的机器人,比如之前火爆全网、来自波士顿动力公司的机器狗Spot。它可以轻松上下楼梯、搬运重物、巡查街道,等等。

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

波士顿动力公司机器狗Spot按下把手开门通过

机器狗由一个运行着Android系统的遥控手柄控制,人们可以通过摄像头随时查看它的状态,并提供指引爬上爬下、行走翻身。这当然很棒,但当我们想给机器人传达更复杂的动作指令时,在手柄上相应的操作就繁琐了很多。能不能开发出一种更易用、直观的人机交互方法,能让我们更轻松地发送指令给机器人呢?与其在一个小屏幕上戳来戳去控制不同的机械参数,能不能直接告诉机器人具体的指令,让它去做什么呢?

近日,由李飞飞教授及来自斯坦福大学、加州理工、清华大学和英伟达的几位学者组成的团队(Yunfan Jiang,Agrim Gupta,Zichen Zhang,Guanzhi Wang,Yongqiang Dou,Yanjun Chen,Li Fei-Fei,Anima Anandkumar,Yuke Zhu,Linxi Fan)发推,分享他们全新的研究结果:VIMA(Vision-and-Language Navigation with Multi-Modal Transformers),一个使用多模态提示执行各类任务的机械体操作系统。

也就是说,在Prompt中输入文字、图片、视频,或任意的组合,VIMA就可以控制机械臂执行相应的动作。

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

VIMA将多模态提示用于任务规范

VIMA能做什么?场景事例

如下图,输入指令「把形状一样的物品放到绿色碗(图片)里」给VIMA。

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!
VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

最后来看这个例子。

我们甚至可以在prompt教给它新的视觉概念,输入指令「这是一个zup <灰色方框图片>,这是一个blicket <灰色十字图片>。将blicket放进zup里。」

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

机械臂系统的组成结构

VIMA主要由以下几个部分组成:Transformer编码器和解码器 :用于对多模态提示进行编码和机器人臂的控制进行解码。视觉和语言模块 :用于处理视觉和语言输入,并将它们转换为Transformer可以处理的令牌序列。动作执行器 :用于将机器人臂的控制信号转换为物理动作,并将其发送到机器人控制器。数据集和基准 :用于评估和比较不同的机器人学习方法,并提供训练和测试数据。物理仿真器 :用于在虚拟环境中模拟机器人的行为,并提供快速的反馈和调试机制。

这些组件共同构成了VIMA的核心部分,使得它能够接收多模态提示并执行各种机器人任务。

在VIMA中,GPT-3模型在第一部分被用作解码器,用于生成导航指令,以指导机器人在环境中执行导航任务。具体来说,VIMA-GPT是一个仅包含解码器的架构,它通过对多模态提示进行编码,自回归地解码给定指令和交互历史的下一个动作,控制机器臂的运动。连接硬件后的VIMA成为了“一个具有体现性的AI代理:它可以感知环境并逐步在物理世界中采取行动。”Fan说到。

软硬件结合的AI系统能做什么

团队共实现了17个不同的任务,分为6大类: 简单物体操作(Simple object manipulation)、 视觉目标达成(Visual goal reaching)、 新概念理解(Novel concept grounding)、 单次视频模仿(One-shot video imitation)、 视觉约束满足(Visual constraint satisfaction)、 视觉推理(Visual reasoning)。

Fan在他的推文中提及:“多模态提示使得任务规范对用户来说更加容易和灵活。通过一个单一的模型,VIMA将视觉目标达成、从视频演示中进行一次性模仿、学习新概念以及满足安全约束等多种任务统一起来。而在以前的工作中,每个任务都需要不同的训练流程。”

作为一个机器人控制的框架,VIMA可以扩展成为极其强大的工具。像是一个实体的小爱同学,在学习完所有的步骤和物品之后,它可以你成为现实生活里的左膀右臂,例如:家务。告诉它你想吃西红柿炒鸡蛋,VIMA在厨房里找到材料、开火、放糖(北方同学大喜),自动化炒菜。教育。在学校的自习课替老师回答问题,并在黑板上拿粉笔写笔记,为学生提供定制练习和反馈。娱乐。投篮后每次替你捡球送水的女同学,一个VIMA机器人就能替代,甚至更体贴。

当然,上面的例子过于理想了,但并不是不可能实现。

VIMA:更适合机械宝宝体质的操作系统,竟然内置LLM!

模型结构:编码-解码转换器

结语

VIMA作为一个仍在开发中的基础模型,为智能机械体的发展方向指明了更切实的发展方向。它有可能使机器人更智能、更有用。而如此强大的工具将其所有内容全部开源:代码、预训练模型、数据集和物理仿真基准都可以免费获取和使用!代码的透明度和可重复性被提高,更多的人可以使用和改进VIMA框架,促进了合作和知识共享,这对推动机器人学习领域的发展起到了巨大的作用。

将机器人和LLM整合,相当于让机器人有了大脑!长期来说,利好智能设备的功能增强,短期来说,B站上如稚晖君的一批知名UP主,又可以整活了。

参考链接:

https://arxiv.org/abs/2210.03094

https://vimalabs.github.io

https://twitter.com/DrJimFan/status/1683517085731913729

▶ 香港高校陆续拥抱 ChatGPT;iPhone 14 被用户吐槽电池老化;Firefox 116 发布|极客头条

▶ 重磅!全球云原生技术顶会KubeCon China 2023详细议程公布!

▶ 室温超导真要来了?一文读懂来龙去脉

粉丝福利:返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-03 20:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...饲料;蚕宝宝住上“公寓楼”,室内温度、湿度均可调节机器人当上“蚕娘”本报记者 黄仕强《工人日报》(2023年09月12日 06版)阅读提示在现代蚕桑产业仙龙基地,家蚕的“粮食
2023-09-12 04:26:00
广东首例!6个月宝宝心外手术用上“达芬奇”机器人
...女儿童医疗中心(下称“广妇儿”)心脏中心使用达芬奇机器人辅助外科手术系统(下称“达芬奇”)顺利为一位六个月大的患者完成血管环(双主动脉弓)矫治,实现广东首例小体重儿在手术机器
2023-11-09 18:15:00
鲶鱼进场,追觅闯入具身智能腹地
...苦。如今,这个需求可以在装有仿生多关节机械手的扫地机器人中得到解决了。就在上周,一年一度的中国家电及消费电子博览会如期而至,在这场国内新兴消费电子产品的嘉年华中,能闻到品牌之
2025-03-25 11:10:00
AI舌诊、机械臂SPA!看山东展区玩转中医药文化
...案的电子健康报告。展会现场还将设置知名中医与AI中医机器人双诊体验区,既能感受中医与AI人工智能同台“竞技”,又能体验传统中医智慧与现代科技的碰撞。机械按摩师上岗智慧理疗更有
2025-05-23 18:58:00
能做饭洗衣 会看病下棋 科普展上机器人炫出“十八般武艺”
观众正在欣赏机器人跳舞。 机器人正在做汉堡。一名学生与机器人对弈。 扫码观看视频机器人做家务、机器人陪你下棋、机器人问诊……4月19日至20日,由环梦科技、中科检测、云之谷科
2025-04-22 07:30:00
比好莱坞大片更接地气!这才是适合中国宝宝体质的“科幻”
...庭原本的祥和。坚信爸爸活着的莫莉,决定同她的废柴的机器人阿鲁一起探寻找到爸爸的办法。你有没有在这个世界感到过无比的孤独?有没有怀疑身边的一切是不真实的?国产科幻电影《我看见两
2023-08-03 18:43:00
携手上海天文馆发布硬核新品 石头科技首创仿生机械手重构清...
...的5轴折叠仿生机械手,打破了传统清洁的局限,让扫地机器人从单一的地面清洁工具,进化为空间避障与家庭整理的全能助手。此前在宇宙探索以及工业制造起到重要作用的机械手,第一次走进家
2025-02-26 16:12:00
美的集团首席AI官唐剑:AI和智能机器人是家电行业巨大的机遇|新质生产力·AI Partner大会
...家居事业板块之外,我们还有工业技术板块、楼宇科技、机器人与自动化、智慧物流、智慧医疗在内新型业务板块。基于五大板块,我们在AI方向布局了五个方向,分别是家居、制造、能源、医疗
2024-05-31 13:58:00
...神情专注而坚定,分组对机械臂进行调试……极具看点的机器人系统集成赛项成为赛场上的一大亮点。据了解,机器人系统集成是指根据工作任务的需要,将机器人系统集成(组装)到整体的过程,
2024-10-19 11:06:00
更多关于科技的资讯:
江南时报讯 近日,苏州农商银行与人保财险苏州市分公司深化协同,成功落地全国首单银保合作“科创贷”。该企业作为国家级高新技术企业
2026-02-10 21:42:00
西秀食品“双星”冲刺首季“开门红”
连日来,位于西秀区的贵州安顺云鹫食品有限公司和贵州好味达食品有限公司呈现一派热火朝天的生产景象。作为本土食品行业的标杆企业
2026-02-10 22:10:00
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00