我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解决

类别：科技发布时间：2024-04-26 23:00:00 来源：砍柴网

今年 3 月，一段两分半钟的视频点击量破百万。没有太多花哨的情节，白色背景前，一个人形机器人遵照人类指令，递给对方苹果，归置好桌上的杯子和餐碟，并解释这样做的原因。

这段视频来自当红人形机器人初创公司 Figure。成立不过两年，Figure 估值已达 26 亿美元，其投资人包括微软、英伟达、英特尔、贝佐斯等，被戏称金主覆盖半个硅谷。

视频中，Figure 机器人启动页面，出现醒目的 "powered by OpenAI"。除了自己开发的神经网络技术，Figure 这款产品背后显然有 OpenAI 的生成式 AI 支撑。

AI 让人形机器人拥有新的可能。一个诞生于 1950 年的概念 " 具身智能 "（Embodied Artificial Intelligence）进入人们视野。

在这一概念下，借助大模型，机器人感知、决策与交互提升，具备更强的自主学习能力和环境适应性。机器人赋予大模型现实的物理载体，让曾经的虚拟智能走进现实世界。

技术和现实的交织足以掀起广阔的想象，业界普遍认为具身智能将是一个万亿市场。

最近一系列的行业进展似乎给出了证明：2 月份， FigureAI 完成 6.75 亿美元融资；3 月份，英伟达发布人形机器人通用模型 Project GR00T，推动机器人理解自然语言，并观察人类行为模仿动作；同是 3 月份，斯坦福李飞飞团队发布开源 " 灵巧手 "、成本仅 2.5 万美元；而在 4 月 16 日，波士顿动力先是宣布了数字液压驱动的双足人形机器人 Atlas 退役，不到 12 小时又发布了代表力量与灵活的全电驱动 Atlas 001，展现出腰与脖的全向旋转机构及髋部球形关节……

一级市场的机器人项目投资火热，二级市场的核心零部件厂商、概念股也风起潮涌，人形机器人公司优必选上市后，市值一度超过千亿港元。

然而，" 机器人 + 大模型 " 落地狂潮中，仍有保持谨慎乐观的少数者。北航机器人研究所名誉所长、中关村智友研究院院长王田苗就是其中一员。

北航机器人研究所名誉所长、中关村智友研究院院长王田苗

90 年代初，中国工业机器人尚在萌芽期，王田苗已经进入一个和移动机器人相关的国家重大项目组中，研究无人驾驶技术。30 多年过去，王田苗和团队研发出国内第一款获得许可证的医疗机器人，也成为硬科技领域低调但不可忽视的创业导师。

2020 年，王田苗联合十五位科学家发起成立了 " 智友科学家基金 "，一如既往，王田苗和团队希望发现和培育服务国家科技战略的早期硬科技项目。具身智能、机器人、机器人上游核心部件正是他关注的重要领域。

与硬氪交流的一个多小时里，王田苗语气中难掩对具身智能或将掀起产业变革的兴奋。中关村智友研究院已经覆盖包括高精度 RV 减速器、全真精密光学影像系统、力传感器柔性智能装备、具身智能 AI 通用机器人平台等软硬件方向。

但在行业沉浮三十多年后，王田苗早已习惯以冷静的目光审视狂热。以 Figure 发布的产品为例，"Figure 机器人在视频中呈现的延迟时长约为 2-3 秒，它使用了 Pipeline、管道型路线，即自然语言发送后、机器人大脑可以理解并生成指令，由指令来控制。当接入通用大脑后，其延迟速度约要乘以 20 倍。" 王田苗告诉硬氪。

具身智能走过半个多世纪，某一款产品的爆火消弭并不会落地和商业化等现实性问题。一个温度骤升的行业需要这样的视角，才不至于在蜂拥而入的资本和宏大叙事中迷失。

围绕具身智能的机遇与挑战话题，硬氪对王田苗进行了专访，以下是本次交流（经编辑）：

有效的机器人通用基础模型还未出现

硬氪：对比上一代机器人技术路径，具身智能的革命性体现在哪里？

王田苗：具身智能强调和追求机器人泛化及大规模应用。第一，它通过嵌入大模型交互，使机器人能够听懂语言，理解客户的指示，并让具身智能体到相应的地方进行操作。第二是结构化的固定环境加上感知垂直大模型，能识别并重建环节，拓宽机器人使用的环境，提高智能化水平。因此，人们期待具身智能即大模型 + 机器人能够实现 " 一脑多机 " 或 " 一脑多型 " 的爆发。

硬氪：具身智能真正得到学术界、工业界、金融界重视是在这两三年。狭义来看，是否可以理解为让机器人通过自我学习进行认知和决策，从而完成相应的任务？

王田苗：从大语言模型的发展开始，我们可以看到语言处理领域的显著进步。传统的解决方法通常是依赖于知识图谱，并结合人为设计的逻辑以及多个小任务模型来解决问题。然而随着技术不断进步，尤其是 AlphaGo 在围棋领域的优秀表现，以及 AlphaZero 在蛋白质分析方面的突破，人们开始期待用一个通用模型的训练和微调，来解决所有问题。这也是为什么大模型被视为未来社会数字化、智能化、治理化的运行底座。

机器人作为人们改造世界的工具，具身智能概念诞生后，人们开始思考，机器人领域是不是也能诞生这样通用大模型。

目前工业机器人的装机总量约为 300 万台，每年世界 60 万台，中国占总量的一半、是 30 万台。有这样一个 " 通用大脑 " 后，就能大规模、高效率地泛化迁移应用，解决许多问题。

硬氪：那这个机器人通用模型现在出现了吗？

王田苗：目前还没有一个有效的模型出现。

以实时性问题为例。Figure 机器人在视频中呈现的延迟时长约为 2-3 秒，它使用了 Pipeline、管道型路线，即自然语言发送后、机器人大脑可以理解并生成指令，由指令来控制。当接入通用大脑后，其延迟速度约要乘以 20 倍。

硬氪：有什么解决方案？

王田苗：常见的解决方案是，为不同的任务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。

硬氪：今年有哪些细分场景的模型值得关注？

王田苗：今年 3 月，李飞飞团队开发 Behavior-1K，完成了对 1000 种日常活动的定义，并以房屋、花园、餐厅、办公室等 50 个场景为基础，标注 9000 多个拥有丰富物理和语义属性的物体。

接着到 4 月，特斯拉推出多模态大模型 Grok-1.5v，利用端到端高速大模型 FSD 推理，有望连接数字世界与物理世界，解决自动驾驶边缘案例的在线迭代学习问题。

硬氪：业界对机器人「大脑 + 小脑」路线的关注度很高。大脑用大模型认知智能、人机交互以及相关场景的调动，小脑实时控制机器人本体，产生灵巧操作，随着大模型能力提升，是否有可能反哺给小脑，进而带动其感知、行为等能力提升？另外有关技能型劳动操作，会不会具有专业小模型，分别实现高效作业比如焊工、钳工、车工、打磨抛光、喷涂、装配、拆装等。

王田苗：这个问题正是目前学术界、产业界所关注，并且产生争议的地方。

大脑主要负责慢思维与推理，是智力的核心所在；而小脑则关联着对事物的反应敏感程度，更多涉及身体的协调与运动的控制。从逻辑上讲，人们希望今后机器人的大脑能越来越聪明、弱化小脑能力，力图通过大模型得以统一。比如大模型知道什么是苹果，也知道苹果可以饱腹，当我们向机器人提问 " 什么东西能吃 " 时，机器人就能自动取出一个苹果。但要真正实现它，现阶段仍有很多挑战。

在人类历史进化过程中，人类行为的智能进化远远先于语言智能的进化。这可能意味着语言、视觉感知、触觉感知以及行为等智能在大脑图谱中并不是同一个位置，很可能是由不同模型所驱动的。莫拉维克悖论也揭示了这一现象 -- 电脑下棋容易、感知和行动智能方面却面临挑战，这通常表现为顶层智能的智能程度高、精度差、反应慢，而底层智能的智能程度低、精度高、反应快。

硬氪：更具体看，还有哪些问题是没有解决的？

王田苗：首先是如何让机器人的 " 大脑 " 更聪明。现阶段机器人在解决复杂环境感知、动作生成、灵巧操作等问题时存在局限性。尽管大模型增强了其学习、语义理解、推理及判断能力，但在从理解、推理、判断、执行到运动系列过程中，还涉及其他多种模型算法和软硬件协同的问题，包括感知智能模型、行为智能模型以及原有智能控制理论，如 MPC 模型预测控制与 WBC 全身协调控制等。

问题一：机器人基础大模型 RFMS 问题

同时，Scaling laws（尺度定律，这一定律表明，模型大小、数据集大小和用于训练的计算浮点数，与模型的性能存在线性相关。）能否在机器人基础大模型中复现尚未可知，这些技术的开发和迭代本身具有难度，再加上周期较长、投入高，短期内要突破关键技术仍面临着不小的挑战和风险。

问题二：智能进化与大小模型问题

第三是要解决具身智能大模型与硬件的融合、配合问题。人形机器人的整机结构复杂，仅零部件就超过 5000 个，从理解指令到执行任务，都是极大的工程量。

因此有观点提出，在机器人的智能层、感知层、动作层中分设 Agent，由 Agent 来调用工具解决具体问题。

问题三：具身智能的体系结构问题

最后就是落地环节。机器人产品化过程需要用时间来产生并验证价值，如果说研究具身智能的出发点是为了降低时间成本或提升效率，进而实现生产力的飞跃，而非为了取代人类工作，那么基于场景的融合打磨与迭代至关重要。

问题四：劳动型具身智能研发优先应用的领域问题

硬氪：要实现专业和通用，过程中的难点是什么？

王田苗：软件方面的挑战主要是真实、实用、海量数据的产生与训练问题。其中，数据收集尤为关键，机器人所需的数据不仅涵盖互联网数据和视频采集数据，更需要包括众多物理环境中的真实交互数据，这些模拟生成的数据是难以替代的。

此外，数据对齐也是一大难题。语言模型能够学习并生成人类能理解的语言，但在机器人领域，我们面临着海量未标注的异构行为大数据，这使得语义与数据的对齐变得异常困难。其中还涉及到语义歧义问题、模型可能产生的幻觉的安全问题，以及标准化测试平台和训练完成后安全使用评价问题等。

另一方面就是效率与成本问题。从仿生机器人的发展历程来看，自 1997 年日本本田推出的 Asimo 人形机器人，到 2008 年波士顿动力的大狗机器人，再到后续活蹦乱跳的人形机器人，甚至从特斯拉人形机器人到 Figure 人形机器人，我们确实见证了具身智能在大模型、感知、算力等方面有了重大突破。

然而，不能忽视的是，具身智能在结构、驱动、动力等真实能力方面，尚未实现根本性的突破。其中，行为智能成功成本，与 " 行为数据采样学习次数 " 乘以 " 每一次训练成功的成本 " 得到的结果相比，其比值仍然远远小于 1。这导致具身智能的载体性物种在灵巧性、成本性、能源维护性、使用体验安全性等方面仍存在诸多挑战，距离通用机器人走向千家万户还有距离。

此外，实时性和推理速度也是当前具身智能面临的重要问题。目前基于大模型的机器人控制周期在线决策最快也需要 50ms，一般延迟达 1-5 秒，这远远无法满足目前工业应用中对机器人要求 10ms 以下，最好在 3ms 的要求。

硬氪：在机器人和 AI 结合中，有哪些比较关键的成本？

王田苗：机器人结构复杂，核心零部件决定了其精度、稳定性、负荷能力等重要性能指标，其中技术难度最高分别是减速器、伺服系统和控制器，占成本的 60-70%。加上传感器等其他零部件，都会增加机器人的制造和后期维护的成本。

此外，为了解决实时性问题，需要大量 GPU 算力与训练的能耗。有研究测算，每个 token（1000 token 约为 750 个单词）的训练成本通常约为 6N（N 为参数的计量单位），推理成本约 2N，即推理成本相当于训练成本的三分之一。

机器人的三大主导方向

硬氪：面向开放场景的泛化问题，技术上该怎么解决？

王田苗：从具身智能的体系结构出发，对机器人下达拿水杯的指令时，这是意图；机器人会将其分解为具体的运动步骤，包括视觉范围内看到水杯、接近、拿起，一系列动作由感知模型和操作模型协同完成，当机器人后续面对多任务场景时，理想状态下它能够利用先前的经验进行复制泛化，减少对编程水平和质量要求。

现实生活中，由于所有的视觉感知都是变化的，人机交互、任务规划、动作轨迹和操作模型需要应对突发性事件，由此也有想法提出，每一层都应有一个具身代理，再根据特定任务产出领域大模型。

硬氪：具身智能会优先在哪些场景中落地？

王田苗：从广义来看，将机器人和大模型运用在社会上，我坚信会从商务、工业、最后再进入消费环节。

其中，商务场景包括物流（室内外与低空）、出租、药店、超市、清洁、接待等，更容易率先取得突破性进展；第二类是工业与农业，工业包括汽车、核工业、化学药品、医院传染病处置、电池回收拆装等，农业则包括种植、采摘、分拣、屠宰、上下料、预制菜、包装等；最后才是消费场景，例如打扫、炒菜、陪护、养老、打扫房间、护工保姆等。

硬氪：在产品形态上是否有创新空间？

田苗：当然。一方面，有工业界和理性的企业热衷于用新技术、新形态去探索专业化的新应用，他们注重技术的实用性和对专业领域的适用性，希望通过不断的技术创新来推动业务发展。

另一方面，大部分学者或怀揣梦想的创业者则认为通用大模型 + 人形机器人是未来的发展方向，更关注技术的前沿性和未来潜力，相信技术将为人类社会带来革命性的影响。

二者有所不同，前者注重应用上的创新性，后者是完全颠覆性的创新，两条路线哪一条率先走通，都离不开市场检验。我们看到，在物流、清洁、无人出租车等场景中，并没有人形机器人的身影，包括焊接、喷涂等环节中多有应用。市场和供求关系紧密相关，家庭环境更关注其智能化、情感化、安全化，工业场景更强调效率、准确率和成本，场景约束不同，两类场景会刺激不同类型的机器人及其核心零部件创新。

硬氪：如何看待机器人接下来要重点突破的发展趋势？

王田苗：当下有三个主导方向。

第一是攻克核心零部件，包括高动态、高精度、高扭矩的驱动单元，刚柔耦合的新材料灵巧手，人工肌肉与电子皮肤，低成本的生物传感器，上游正向设计的电机或减速器等。

第二是夯实垂直应用并通过出海获得利润，特别是面向具有连锁店或生产服务属性的中小微企业，提供服务应用。

第三是拥抱大模型。包括大脑机器人基础大模型，具身代理 Agents，低功耗专用小模型算力 GPU 与编译器，以及生成式数据动作库；同时，关注小脑实时技能操作、行为智能控制和实时安全评测等方面的技术进展；免编程与安全算法，通用机器人与人形机器人应用 App 的开发也是重要一环；此外，数据服务 -- 垂直模型专用技能数据服务公司，" 劳动 " 派遣运营服务公司等也有望成为产业链中不可或缺的一方。相信大模型和机器人会是未来大国可持续竞争力的发展焦点。

未来具身智能的新工业发展机遇

总结来看，回顾过去的自动化终端产品，能达到万亿规模的赛道需要同时满足三个要素，分别是市场、产业链和技术突破，与此同时还应该潜在具有 2G、2B、2C 的应用属性，机器人就是这样理念下的一种重要体现。

来源：36氪返回搜狐，查看更多

责任编辑：

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-04-26 23:45:09

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于机器人,模型,对话,机器,问题,市场的资讯：

华为新聊天机器人专利曝光：可根据内容自适应准确回复

...近在获得了一项“一种人机对话的系统和方法”新的聊天机器人专利授权，申请号为CN113505205A。专利中最新的聊天机器人程序展示了华为的技术，可以产生自适应的回复即根据话题

2023-06-16 09:34:00

2024云栖大会一线观察 “云上对话”聚焦三大话题

...模型为代表的AGI（通用人工智能）发展、自动驾驶、人形机器人，邀请身处行业一线的企业家、科学家坐在一起交流碰撞。这三大场景，是当下探讨生成式人工智能发展颇为关注的热门领域，也

2024-09-21 10:31:00

AI大模型时代，如何用RAG技术重塑传统智能客服问答机器人？

...一样理解大家的意图（文本+图片），所以原本智能对话机器人的实现不仅费时费力，且还没有一个很好的效果，导致“在智能对话机器人的部分，在晚上10：50我还测试了部分淘宝店家，发现

2024-03-26 14:07:00

人形机器人“步行”参展上交会，会笑、会眨眼的机器人正研制

...上海世博展览馆开幕。在入馆人流中，有一位特殊的双足机器人，在众人瞩目下完成了从世博展览馆北广场“步行”到H1馆展台的参展之旅。第十届中国（上海）国际技术进出口交易会6月12日

2024-06-13 10:31:00

“中医大脑GPT”发布：人机同席话中医，你岂能错过这场对话

...个问题时，脑海中可能会浮现出电影《终结者》中邪恶的机器人，或者《变形金刚》中的擎天柱，或者想象出一个无所不能的机器

2023-12-05 10:25:00

ChatGPT走俏：车载语音交互“驶”向风口

...用软件。和“什么都能往里装”的元宇宙相比，这款聊天机器人似乎更接地气、更有实用价值。ChatGPT上线后，很多用户怀揣好奇心与其对话，其对很多宏大问题给出的答复着实令人称叹。

2023-02-23 18:00:00

让电话机器人告别死板对话，容联云推出容犀Copilot，陪聊

作者｜武静静编辑｜邓咏仪谈及客服机器人，很多人第一反应就是，无聊、乏味，还听不懂人话。如今，有了大模型，新的对话机器人已经和真人无异了——不仅对业务问题对答如流，还能根据用户发问

2023-12-22 14:45:00

黄仁勋对话扎克伯格：下一波AI浪潮是机器人，开源大模型将赢得

...AI发展中的重要性。对话下半场，他们围AR/VR计算平台和机器人浪潮等展开了讨论，指出下一波AI浪潮是机器人，而AR眼镜未来或替代智能手机。炉边谈话接近尾声时，黄仁勋和扎克伯

2024-07-31 13:51:00

清华大学孙富春：大模型+机器人可能会导致失业，未来80%的人

...话清华大学计算机系教授，清华大学人工智能研究院智能机器人中心主任孙富春。嘉宾简介：孙富春，清华大学计算机科学与技术系教授，博士生导师，清华大学校学术委员会委员，清华大学人工智

2023-10-27 18:02:00

更多关于科技的资讯：

聚焦2025中国国际数字经济博览会·访谈｜沈昌祥：发挥优势，

发挥优势，不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。河北日报记者李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”

2025-10-18 08:25:00

纵览视频丨挑战全网最快肖像师，精准捕捉微笑的弧度，被这只机械

10月17日，2025中国国际数字经济博览会，一款AI绘画机器人精准识别人脸神态，快速绘画出人脸素描，被这只机械臂画得心服口服。（摄制：苏畅、白中豪、朱泊宇）

2025-10-18 08:27:00

聚焦2025中国国际数字经济博览会·记者观察｜深化开发利用，

深化开发利用，让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日

2025-10-18 08:37:00

eSIM来了！比实体卡更抗损坏三大运营商启动办理服务

厦门网讯（厦门日报记者薛尧）苹果iPhone17 Air昨日正式开启预售，这款取消实体卡槽、仅支持eSIM（嵌入式虚拟SIM卡）的新机

2025-10-18 08:59:00

助力点燃金秋文旅消费热潮建行信用卡“‘享趣’玩·惠游中华”

近日，建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动，为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠

2025-10-18 10:41:00

海信贾少谦：AI重塑企业管理模式，打法要快，生意要慢

10月17日，第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人

2025-10-18 10:57:00

竹溪县数字经济产业链招商签约超亿元

十堰广电讯（全媒体记者白孟尧通讯员付延峰）竞逐数字经济新赛道，孕育产业链招商硕果。10月18日，湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行

2025-10-18 13:47:00

工行龙岩漳平支行：精准赋能将金融服务送进企业

东南网龙岩10月17日讯（通讯员陈碧霞）近日，工行龙岩漳平支行组织青年志愿者主动深入当地企业园区，精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动

2025-10-18 16:32:00

烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单

近日，由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上，烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例

2025-10-18 17:45:00

视源股份广交会展示AI全场景创新实力，机器人机器人系列产品亮

在第138届中国进出口商品交易会（广交会）上，视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线

2025-10-18 18:18:00

本土智造重磅升级，医科达将八度亮相进博

第八届中国国际进口博览会（进博会）进入倒计时，作为八年“全勤生”，全球精准放疗先锋医科达将以“共建本土生态，共筑抗癌未来”为主题

2025-10-18 18:42:00

不用等到20号了！现在来京东11.11 iPhone 17

每年11.11对于广大果粉而言无疑是换新的绝佳时机，无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格

2025-10-18 18:43:00

破局重构引领前行，联众优车持续锻造二手车服务新基建

近年来，在国内汽车消费结构持续升级的背景下，二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出

2025-10-18 18:43:00

从龙虎到鹤年堂京东七鲜十月品牌日再造下一个老字号联名爆款

随着“养生年轻化”与“即食化养生”成为主流，当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常

2025-10-18 18:43:00

全时段畅飞全年不限次：长龙航空“365畅飞卡”10月19日

国内随心飞历史新低，全时段畅飞、全年不限次！在推出海航随心飞，并创下2天超25万用户下单、2亿销售额的纪录之后，京东11

2025-10-18 18:45:00

头条订阅服务

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解决