模型,场景,训练,语言,数据,物体头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-mo...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

GR-2登场！ByteDance Research提出机器人

最近，ByteDance Research 的第二代机器人大模型 —— GR-2，终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性，预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面：https://gr2-manipulation...……更多

2024-10-10 09:57:00模型,机器,世界,物体,任务,机器

机器人迈向ChatGPT时刻！清华团队首次发现具身智能Sca

...专家 Ted Xiao 都忍不住为这项研究点赞，称其对机器人大模型时代具有里程碑意义！ Scaling Laws：从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗？答案就是 scaling laws！现在，清华团队首次证明：这个法则在机器...……更多

2024-11-04 09:52:00清华,机器人,团队,机器,时刻,智能

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

【新智元导读】全球首个支持多主体一致性的多模态模型，刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多智能体...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...但很可能永远都达不到；有专家认为，大家对大数据和大模型关注度太高了，现在的人形机器人应该更多关注机器人本体。而关于具身智能，身为北京大学计算机学院前沿计算研究中心（CFCS）助理教授、博士生导师，同时又是...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究

视频生成模型虽然可以生成一些看似符合常识的视频，但被证实目前还无法理解物理规律！自从 Sora 横空出世，业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示，基于文本提示生...……更多

2024-11-09 09:59:00模型,豆包,系统性,字节,规律,团队

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

今天，世界见证了 RDT 大模型的诞生，它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示：有了十亿参数的 RDT ，智能机器人时代不远矣！去酒吧点 RDT 调酒师，赛博朋克感瞬间拉满。在领略了 RDT 的强大后，是时...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...【新智元导读】Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

聪明“脑”指挥灵巧“手”

...、开瓶盖，在日复一日大数据加持的交互学习中，具身大模型机器人训练出决策的“大脑”和执行的“小脑”，指挥日渐灵巧的“手”，能够独立完成越来越多的工作。北京银河通用机器人有限公司（以下简称“银河通用”）专...……更多

2024-05-10 07:59:00灵巧,指挥,机器人,机器,银河,能力

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal：通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D：无需训练的「...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

最新美国国家人工智能科学院院士介绍

...。他在自然语言处理领域取得了显著成果，特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互，提高了智能助手的性能和用户体验。RichardSutton，强化学习之父、阿尔伯塔大学教授。他对强化学...……更多

2024-03-24 08:39:00人工智能,美国,院士,科学院,人工,智能

千寻智能韩峰涛：到2025年底，投资人会更看好具身智能

...现涌现（Emergence），是生成式AI浪潮的一个关键现象：当模型规模扩大至临界点，AI会展现出人类一般的智慧，能理解、学习甚至创造。「涌现」也发生在现实世界——硅基文明一触即发，AI领域的创业者、创造者，正在用他们的...……更多

2025-04-01 10:57:00智能,投资人,投资,智能,机器人,模型

Meta、斯坦福大学用生成式AI实现3D空间环境人机交互

... Synthesis/可控人-物交互合成），而它采用最新的条件扩散模型技术来产生无缝和精确的交互，比如“把桌子举过头顶，走路，放下桌子”。展望未来，以后的虚拟生物将可以像人类一样流畅地理解和响应语言命令，而系统可以从...……更多

2023-12-12 10:04:00斯坦福大学,斯坦,人机,生成,环境,空间

李飞飞空间智能之后，上交、智源、北大提出空间大模型Spati

...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成，导师为本文通讯作者赵波教授。此前，李飞飞老师提出了空间智能 (Spatial Intel...……更多

2024-08-08 09:39:00空间,北大,模型,智能,深度,模型

全球首例机器人刮胡子，斯坦福校友1年拿下3轮数亿融资！红杉领

...（Plug and Play China）、MFund魔量资本等知名创投基金。在大模型风靡的2024年，如果说AI领域还有哪些热点，「具身智能」必定位列其中。全国具身智能领域赛道火热，为何明星基金齐聚穹彻智能？从下面的demo中，我们可以窥见一...……更多

2024-12-06 09:55:00数亿,斯坦,斯坦福,红杉,首例,机器人

北京新型研发机构探索前沿科技多项全球领先AI成果集结亮相

...的中关村展示中心开幕。全球首个低碳单体稠密万亿语言模型，全球领先真机实验成功率突破95%的泛化抓取技术，能反思、可随机应变的铰接物体操作大模型系统、全球首个智能心脏超声机器人……作为专注于人工智能的北京新...……更多

2024-06-15 06:52:00研发机构,北京,成果,领先,机构,全球

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...其坚定信心及历史使命。以下为访谈实录：建立 “世界模型”触发机器人 “灵性”问：被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向，引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖，

...、茶壶倒水任务，所有这些都不需要特定任务数据或环境模型。打包鞋子折叠衣物放置书籍茶壶倒水机器人操纵涉及与环境中物体的复杂交互，这些交互通常可以用空间和时间领域的约束条件来表示。请看上列视频中将茶倒入杯...……更多

2024-12-04 09:51:00一城,研讨会,研讨,团队,智能,论文

可量化灵巧度指数的灵巧手问世！中国团队用“量化体系”撕破“伪

...式，不仅使产品更贴合实际应用场景的功能需求，更为\"模型定义硬件\"的理念提供了准确的生物学参数与工程约束条件，形成从模型到硬件验证的闭环优化链路。灵巧手的发展需要在自由度、驱动方式、感知能力等维度之间找...……更多

2025-05-30 14:01:00灵巧,困局,中国,团队,指数,体系

OpenAI没有放弃的机器人梦想

... ：“一种可能准确但带有讽刺意味的观点是，研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明，OpenAI的确在大语言模型方面取得了更大突破。不过，OpenAI忘记机器人了吗？「甲子光年」在2023北京...……更多

2024-03-18 10:00:00机器人,机器,梦想,机器人,机器,模型

创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

最近的大模型行业，似乎有一种「暴风雨来临前的平静」。整个 8 月，OpenAI 连续不断的行动似乎在告诉我们：风向要变了。从发布 System Card，开放大模型微调能力，再到针对逻辑能力改进，可个性化训练部署的「草莓」模型，...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

昆仑万维SkyReels团队正式发布并开源SkyReels-

...个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型，其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

商汤科技发布日日新5.0大模型

本文转自：劳动报商汤科技发布日日新5.0大模型五大产品全新亮相局部能力赶超GPT-4本报讯（劳动报记者陈宁）日前，在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场，商汤发布行业首个“云、端、边”全栈大模...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型