• 我的订阅
  • 头条热搜
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...出图像目标表示(IGOR,Image-GOal Representation),“投喂”模型人类与现实世界的交互数据。IGOR能直接为人类和机器人学习一个统一的动作表示空间,实现跨任务和智能体的知识迁移以及下游任务效果的提升。要知道,在训练具身...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。不论是寻找物体,走到指定位置,还是满足抽象的人类需求,只要你说出指令,InstructNav都能帮你实现。目前该工作已经被CoRL(Conference on Robot Learning)...……更多
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,OpenAI忘记机器人了吗?「甲子光年」在2023北京...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
今天,世界见证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT ,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛博朋克感瞬间拉满。在领略了 RDT 的强大后,是时...……更多
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...,餐厅、超市、办公室、家庭等89个不同场景类别。由大模型驱动的NPC,可以在这个世界里和机器人对话交互。这样一来,各种机器人能在虚拟小镇里完成各种行为模拟,也就是最近流行的Sim2Real路线,能大幅降低具身智能现实...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义! Scaling Laws:从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...的通用形态;也有部分公司的研究侧重于突破机器人全脑模型,希望赋能机器人,让其具备接受人类指令并规划拆解任务的通用决策能力。千诀科技是一家专注于机器人大模型研发的创业公司,希望研究出适配不同机器人设备形...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...al Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。目光转回国内,我们同样在中国公司中发现了这场变革浪潮的先行者。据机器之心了解,国内初创公司自变量机器人(X Square),是国内唯一...……更多
一种以猫眼为模型的新型视觉系统增强了机器人的视觉能力
韩国研究人员受猫独特眼睛结构的启发,为自主无人机和机器人开发出一种先进的视觉系统。 这项新技术采用狭缝式光圈和反射层,可提高各种照明条件下的可视性,促进更有效的物体检测和识别。无人机、自动驾驶汽车和机...……更多
智慧学的智知治志模型的提出和应用
...的智慧学适用在新时代的宇宙和智宇宙空间里的智知治志模型,“智知治志模型”在智能文明和宇宙探索的背景下具有创新性和前瞻性,这是一个将智能机器模型与儒家思想发展相结合的理论框架,通过“智、知、治、志”四个...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
...,翻动双手顺利完成叠衣服的一系列动作。近两年,AI大模型和人形机器人的使用成为科技发展的重要推动力。4月1日,百度与人形机器人企业优必选宣布达成合作,共同探索中国AI大模型和人形机器人的应用。人形机器人接入“...……更多
机器人时代已来!黄仁勋指向AI下一波浪潮:物理AI
...并理解物理定律的AI。“为我们工作的AI,必须理解世界模型,才能理解如何解释世界、如何感知世界。”世界各地的研究人员和公司正在开发由物理AI驱动的机器人,这些AI模型能够理解指令,并在现实世界中自主执行复杂任务...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...、Meta和机器人公司 Hello Robot 的研究团队开发了一系列 AI 模型,称为机器人实用模型(Robot Utility Models,RUMs)。这些模型能够教导机器人在全新的环境中完成基本任务,而无需进一步的训练或微调。研究团队训练了五个 RUMs,分...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
...探讨了这些问题。科大讯飞副总裁、研究院院长刘聪:大模型让人形机器人“行知合一”在没有大模型之前,机器人都是小脑控制的,小脑管运动,对应着硬件能力。那时候有三点受限:任务大部分是专用的,不通用;对负责任...……更多
...、开瓶盖,在日复一日大数据加持的交互学习中,具身大模型机器人训练出决策的“大脑”和执行的“小脑”,指挥日渐灵巧的“手”,能够独立完成越来越多的工作。北京银河通用机器人有限公司(以下简称“银河通用”)专...……更多
BAT等互联网大厂,如何入局人形机器人?
...的选择投资、注资扶持初创企业,更主要的主要是进行大模型的生态合作,总体理念开始强调赋能、共赢,方式开始转向用生态合作、投资的方式收缩触角,强化与主业的关联度方面。互联网巨头企业非常统一的行为,依然能够...……更多
...自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突破,进一步加速了“AI物理化”进程,也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力本报...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...其坚定信心及历史使命。 以下为访谈实录:建立 “世界模型”触发机器人 “灵性”问:被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向,引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多
解锁人形机器人 扫码阅读手机版
...机器人的“类人化”进程明显提速。这背后,人工智能大模型功不可没。由于人形机器人更具通用性,一些传统的工业机器人、服务机器人也存在被替代的风险。未来已来。对人类来说,除了劳动价值外,更聪明、更智能的人形...……更多
谭平:得益于技术发展,虚拟世界有了实现的基础条件
...个相当小众的领域。二十年过去,技术已进步太多:三维模型数据比过去丰富得多,渲染效果也更逼真、更快速。三维模型可以由艺术家手工设计出来,也可以通过对真实物体、场景进行三维重建得到。并且,重建结果的细节更...……更多
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
...造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、社会治理与服务等重大应用需求。今年以来,具身智能正在成为学术界和产业界的热门领域,相关的产品和成果层出不穷。今天,...……更多
...,并基于该标注数据提取不同颜色空间的特征训练决策树模型。为了保证结果的鲁棒性,作者使用5张不同情况下的图像,包括晴天、阴影、光反射、雨天等,从图像中选取135000个像素进行训练,经过消除噪声等步骤后生成的掩...……更多
更多关于科技的资讯:
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
智东西11月22日消息,11月21日,中华人民共和国工业和信息化部官网发布《智慧家庭综合标准化体系建设指南(2024版)》(征求意见稿)
2024-11-23 09:40:00
拿下游戏界「人民选择奖」的《黑神话:悟空》,年底还有更多惊喜
拿下游戏界「人民选择奖」的《黑神话:悟空》,年底还有更多惊喜黎明前线Alan2024/11/23中国游戏,首次以金摇杆历史最高票数获奖
2024-11-23 09:40:00
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
智东西11月22日报道,今日,一年一度的2024 IDEA大会在深圳举行,这场由美国国家工程院外籍院士沈向洋发起的人工智能盛会
2024-11-23 09:42:00
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务
2024-11-23 09:42:00
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月
2024-11-23 09:42:00
如今的智能体,已经像人一样「浏览」视频了,国内就有
当你正在观看一部紧张刺激的动作电影,忽然好奇:“那个角色到底是在哪一集说的那句话?”“这里的背景音乐是什么?”又或者在一场足球比赛中
2024-11-23 09:43:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换
2024-11-23 09:43:00
机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍
【新智元导读】最近,Jim Fan参与的一项研究推出了自动化数据生成系统DexMimicGen。该系统可基于少量人类演示
2024-11-23 09:44:00
OpenAI 与全世界最新锐的团队,想要用 AI 完成对浏览器的「复兴」
AGI 时代如果我们还需要浏览器,那它会是什么「形状」?网景公司创始人 Marc Andreessen 曾过说:浏览器可以说是有史以来对人们生活影响最大的一个软件
2024-11-23 09:44:00
被迫剥离Chrome和安卓?谷歌或将迎来“至暗时刻”
谷歌的“至暗时刻”或许才刚刚开始。当地时间 11 月 20 日晚,美国司法部正式向美国联邦法院提交了一份最终判决建议书(以下简称“建议书”)
2024-11-23 09:48:00
第一批用AI的外贸人已经赢麻了|钛媒体「出海参考」
图片AI生成11月21日傍晚,阿里巴巴集团发布全员邮件宣布成立电商事业群,整合国内外电商业务,同时,邮件中表示,电商进入了新时代
2024-11-23 09:49:00
华为官宣新旗舰鸿蒙平板,重塑智慧办公新高度
11月21日,华为终端正式官宣新旗舰鸿蒙平板将在华为Mate品牌盛典首发亮相。同时,华为终端BG首席执行官何刚也发文表示
2024-11-23 09:50:00
华为手机激活量份额连创近三年新高!同比去年大涨
【CNMO科技消息】在经历快速发展后,华为手机已经重新回到舞台中央。据CNMO了解,华为近三周的手机激活量份额都创下了近三年的新高
2024-11-23 09:50:00
小米 REDMI“Turbo ”逐步承接“K”系列位置,后者继续往上突破
IT之家 11 月 21 日消息,小米 REDMI 全新品牌标识今日正式登场。新标识采用红色设计,代表敢红的心气和能红的底气
2024-11-23 09:50:00
世界首款内生安全 MCU 芯片“ESC0830”在江苏南京发布
IT之家 11 月 22 日消息,第四届网络空间内生安全学术大会今日(11 月 22 日)在江苏南京开幕。紫金山实验室正式发布世界首款内生安全 MCU 芯片“ESC0830”等系列重大科研成果
2024-11-23 09:52:00