• 我的订阅
  • 科技

RoboChallenge测评:π0、π0.5领先,自变量WALL-OSS-Flow零成功率引关注

类别:科技 发布时间:2025-12-04 15:20:00 来源:北青网

在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。

近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到,π0、π0.5 在成功率上遥遥领先其他开源模型。自变量机器人(X Square Robot)的大模型wall-oss-flow虽然在多次企业自我宣传中提到,“基本上和PI、和google在同一个水平线上”,但是在多个任务上成功率偏低。根据公开的测评记录,其在31次测试中大部分成功率为零,这一表现引发业内对其大模型真实能力的讨论。

RoboChallenge是全球首个具身智能的大规模真机评测平台,也是目前行业内最受关注的真实物理机器人评测平台,由Dexmal原力灵机联合Hugging Face发布,被视作“机器人界的硬核基准”。其最大特点是真机真测:评测同时接入UR5、Franka、Aloha 双臂系统以及国产ARX-5 四类主流机器人,统一软件栈并配备多台RGB-D深度相机,以确保任务在高度一致的物理条件下进行。

平台的任务覆盖柔性物体处理、双臂协作、多阶段顺序动作等真实世界的关键难点。其中Table30场景包含30个具有代表性的日常任务,包括叠抹布、整理果篮、插花、开关水龙头等,难度从基础操作递进到长链条组合动作。

据了解,RoboChallenge 之所以被认为更加客观,是因为其采用了 “任务成功率 + 进度评分”的双指标体系。前者统计任务是否完整成功,后者将任务拆解为多个关键阶段并按推进程度累计分值,即便任务未完成也能反映模型做到哪一步,为能力评估提供更细粒度的信息。

在该评测体系中,多款主流开源模型已完成测试。“具身进化论”对比发现,基于Physical Intelligence (Pi)系列构建的π0和π0.5是官方重点基线,它们在成功率与进度得分上整体领先其他开源模型,特别是π0.5,显示出更成熟的任务执行能力。

相比之下,自变量的wall-oss-flow 在相同条件下的表现明显偏弱。测评结果显示:wall-oss-flow共测试31次,其中2次成功率为60%,1次成功率为50%,1次成功率为20%,其余所有任务成功率均为0。

“具身进化论”从进度分情况看到,模型虽然在部分任务中能完成初段动作,但多数情况下未能完成关键步骤,执行链条往往在中段被迫中断。这与平台强调的“多阶段连续操作能力”形成明显差距。

公开信息显示,自变量2023年成立,创始人兼CEO为王潜。今年9月,自变量发布其开源大模型WALL-OSS,自变量在官方宣传稿中强调该模型“具备强大的泛化性和推理能力,在长程操作任务方面表现优于其他基础模型”。

王潜甚至曾在接受媒体采访时表示:“我们(自变量)的模型水平基本上和PI、和google在同一个水平线上。”

但此次RoboChallenge 的评测结果显示,自变量模型的水平、能力在真实机器人执行任务时未能体现,与PI的模型(π0 和 π0.5)也存在明显差距。

一位具身智能从业者对“具身进化论”分析,RoboChallenge的独特价值正是在于提供透明、可复现的真机评估环境,避免主观展示带来的偏差。随着越来越多模型加入测评,业内对“模型真实能力差异”有了更清晰的认知。

对具身智能行业而言,此次结果再次提醒:真正的竞争不在PR宣传中,而在三方认可的评测,学术基准线,以及机器人能否稳定完成任务的那一刻。

真实世界,正在成为检验大模型能力的最终标准。而认识到差距,正是追赶的开始。责任编辑:韩璐(EN053)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-12-05 05:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

自变量机器人王潜:具身智能大模型没法抄国外作业
...源:企业授权2023年,王潜解散基金回国,在深圳创立“自变量机器人”。自成立起不到一年半时间,自变量机器人已完成7轮融资,累计融资金额超10亿元。5月12日,智能涌现独家报道
2025-05-29 15:36:00
首程控股:集团下属机器人产业发展基金投资自变量机器人科技公司
...所管理的北京机器人产业发展投资基金(有限合伙)投资自变量机器人科技(济南)有限公司,进一步促进下一代统一端到端具身智能通用大模型的数据采集、模型训练与场景落地。自变量公司是一
2025-02-25 09:50:00
...器人领域融资和新品发布不断,比如具身智能创业公司“自变量机器人(XSquare)”连续完成Pre-A与Pre-A+轮融资
2024-11-11 12:11:00
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...这场变革浪潮的先行者。据机器之心了解,国内初创公司自变量机器人(X Square),是国内唯一一家从第一天就选择了端到端统一大模型技术路线的公司
2024-11-08 09:48:00
值得收藏!2023 年,你应该知道的所有机器学习算法~
...“为什么”。有几种算法可以用来更好地理解某个模型的自变量和因变量之间的关系。算法线性/逻辑回归:对因变量和一个或多个自变量之间的线性关系进行建模的一种统计方法——可用于了解基
2023-01-25 13:00:00
人形机器人融资,爆爆爆!
...数千万元)、星海图(2亿元)、月泉仿生(近亿元)、自变量机器人(数亿元)等人形机器人企业获得融资。2024年,人形机器人领域有多火?又有哪些企业获得了资本的青睐与追捧呢?据智
2024-11-26 09:42:00
...理决策与预测的强大工具库。回归分析通过构建模型探索自变量与因变量间的关系,利用回归系数解读影响,以R方值评估模型拟合度,将拟合好的回归模型应用于新的数据,进行预测分析,为管理
2024-09-20 04:57:00
谈谈“机器人创业”圈子里的鄙视链丨焦点分析
...前机器人小脑公司「星海图」拿到蚂蚁投资,大脑公司「自变量」、「千诀科技」也先后拿到融资。“现在投资人从投人形,改投具身智能了”,王晟向智能涌现表示,因为大家现在意识到,具身智
2024-11-27 07:24:00
大数据分析方法在期末考试成绩分析中的运用
...绩的影响,我们进行了以物理成绩为因变量、数学成绩为自变量的回归分析,结果如下:上述图表显示,数学成绩和物理成绩之间的相关系数为0.606,表明两者之间存在很高的相关性。确定系
2024-05-20 10:23:00
更多关于科技的资讯:
电商物流共享给南和宠物食品带来什么——河北特色产业集群共享智造故事(九)漫步邢台市南和区,宠物元素扮靓了街头巷尾。一家家宠物食品公司车间厂区里
2025-12-28 07:44:00
12月26日,位于杭州云栖小镇的国家机器人检测与评定中心(总部)浙江检测中心(以下简称“浙江检测中心”)正式启用。机器人从样机走向量产
2025-12-27 08:10:00
喜报|米糠云顺利通过双ISO体系认证,安全与品质再上新台阶
近日,深圳市米糠云科技有限公司顺利通过ISO27001信息安全管理体系认证与ISO9001质量管理体系认证。这标志着公司在信息安全管理和质量管理方面达到了国际标准
2025-12-27 14:34:00
退货仓分拣 “堵点” 怎么破?快宝共配给出答案
近年来,电商与直播电商的迅猛发展,不仅催生出庞大的正向物流需求,更让逆向物流成为快递行业名副其实的“蓝海”。消费者退换货需求呈爆炸式增长
2025-12-27 14:36:00
京东跨年盛典开启 送好礼官方直降五折起 还能抽祝福“大排面”
岁末迎新,跨年不只是一种仪式,更是一场表达与传递的情感盛宴。京东今年再度打造“年度宠粉”跨年盛典,不仅有众多官方直降5折起的尖货好物
2025-12-27 14:36:00
专为X3D处理器打造,技嘉X870E X3D系列主板全面上线
2025年最热门的CPU毫无疑问当属AMD锐龙X3D系列,而技嘉作为AMD核心合作伙伴之一,专为AMD X3D系列处理器量身定制了X870E X3D系列主板
2025-12-27 14:37:00
58同城2025中国好雇主盛典在深举行,勾勒数智时代雇主价值新坐标
12月26日,58同城2025“中国好雇主”盛典在深圳举办。作为国内极具影响力的雇主品牌盛会,本届盛典以“数智驱动,百业共生”为核心主题
2025-12-27 14:38:00
从“终于有了”到“真的好用”:“山大v卡通”鸿蒙版如何回应期待,定义智慧校园新体验
鲁网12月27日讯“终于有NFC校园卡了,自己的学校必须给个好评!”“NFC终于上了!” 在华为应用商店的评论区,山东大学师生们的真实留言
2025-12-27 17:30:00
想在短视频的蓝海遨游?别错过这部“实战指南”
都说“万物皆可短视频”,哪些内容让你眼前一亮?电筒拍大片、夜空光魔法、特效变装秀、用烘焙复刻文物、把大好河山“穿”在身上……在这个创意无限的世界里
2025-12-27 19:55:00
“新”中有数|福建首张文旅研学领域数据产权登记证书落地福州
福州新闻网12月27日讯(记者 颜澜萍)近日,福州冶城集团所属企业福建百宝图科技有限公司通过福建省大数据集团旗下福建省数据产权登记平台
2025-12-27 21:00:00
12月26日,杭州市市场监督管理局召开专题新闻通气会,对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果
2025-12-27 07:39:00
昨天下午,2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿,大赛共收到来自英国
2025-12-27 07:39:00
杭州市西湖区后陡门58号,原本只是城市边缘一个普通的小村子,仅仅三年,这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间
2025-12-27 07:39:00
装有红酒的纸箱从1米多的高度多次抛下,又被送入抗压测试机内,接受300公斤的压力测试,再经斜面冲击台俯冲撞向铁板,红酒依然完好无损……经过这一系列流程
2025-12-27 07:39:00
近日,智联招聘发布的《2025雇佣关系趋势报告》显示,78.2%的职场人每周至少使用一次AI工具开展工作。该《报告》基于大量调研问卷生成
2025-12-27 07:39:00