• 我的订阅
  • 头条热搜
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义! Scaling Laws:从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律!自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
今天,世界见证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT ,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛博朋克感瞬间拉满。在领略了 RDT 的强大后,是时...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
...、开瓶盖,在日复一日大数据加持的交互学习中,具身大模型机器人训练出决策的“大脑”和执行的“小脑”,指挥日渐灵巧的“手”,能够独立完成越来越多的工作。北京银河通用机器人有限公司(以下简称“银河通用”)专...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
Meta、斯坦福大学用生成式AI实现3D空间环境人机交互
... Synthesis/可控人-物交互合成),而它采用最新的条件扩散模型技术来产生无缝和精确的交互,比如“把桌子举过头顶,走路,放下桌子”。展望未来,以后的虚拟生物将可以像人类一样流畅地理解和响应语言命令,而系统可以从...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
全球首例机器人刮胡子,斯坦福校友1年拿下3轮数亿融资!红杉领投圈内热门
...(Plug and Play China)、MFund魔量资本等知名创投基金。在大模型风靡的2024年,如果说AI领域还有哪些热点,「具身智能」必定位列其中。全国具身智能领域赛道火热,为何明星基金齐聚穹彻智能?从下面的demo中,我们可以窥见一...……更多
...的中关村展示中心开幕。全球首个低碳单体稠密万亿语言模型,全球领先真机实验成功率突破95%的泛化抓取技术,能反思、可随机应变的铰接物体操作大模型系统、全球首个智能心脏超声机器人……作为专注于人工智能的北京新...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...其坚定信心及历史使命。 以下为访谈实录:建立 “世界模型”触发机器人 “灵性”问:被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向,引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多
李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!
...、茶壶倒水任务,所有这些都不需要特定任务数据或环境模型。打包鞋子折叠衣物放置书籍茶壶倒水机器人操纵涉及与环境中物体的复杂交互,这些交互通常可以用空间和时间领域的约束条件来表示。请看上列视频中将茶倒入杯...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
最近的大模型行业,似乎有一种「暴风雨来临前的平静」。整个 8 月,OpenAI 连续不断的行动似乎在告诉我们:风向要变了。从发布 System Card,开放大模型微调能力,再到针对逻辑能力改进,可个性化训练部署的「草莓」模型,...……更多
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,OpenAI忘记机器人了吗?「甲子光年」在2023北京...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
大语言模型如何宣告心理学的死亡?
...的本质。但随着人工智能技术的飞速发展,特别是大语言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。AI不再只是技术进步的象征,它已经开始挑战我们对心理学——甚至是我们对智能本身——的传统理解。人工智能...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...的通用形态;也有部分公司的研究侧重于突破机器人全脑模型,希望赋能机器人,让其具备接受人类指令并规划拆解任务的通用决策能力。千诀科技是一家专注于机器人大模型研发的创业公司,希望研究出适配不同机器人设备形...……更多
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
...造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、社会治理与服务等重大应用需求。今年以来,具身智能正在成为学术界和产业界的热门领域,相关的产品和成果层出不穷。今天,...……更多
Pokémon Go开发地理空间大模型,AR眼镜的高精地图?
...布了新一代AR眼镜——RokidGlasses,通过摄像头、多模态大模型以及(玻璃衍射)光波导等技术,在一定程度上让AR眼镜实现了对真实世界的感知与理解,以及对用户的协同与展现。然而就当下来说,AI或者说视觉大模型对真实世界...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
昨晚,世界模型向前迈出了一大步!Google DeepMind 震撼宣布了他们的新一代世界模型 Genie 2,其可根据一张图生成可供人类或 AI 智能体游玩的无限 3D 世界。消息发布后,好评与震惊如潮水般涌现。有人被这技术进步的速度震撼,...……更多
更多关于科技的资讯:
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00