• 我的订阅
  • 头条热搜
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义! Scaling Laws:从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律!自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
今天,世界见证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT ,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛博朋克感瞬间拉满。在领略了 RDT 的强大后,是时...……更多
...、开瓶盖,在日复一日大数据加持的交互学习中,具身大模型机器人训练出决策的“大脑”和执行的“小脑”,指挥日渐灵巧的“手”,能够独立完成越来越多的工作。北京银河通用机器人有限公司(以下简称“银河通用”)专...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
Meta、斯坦福大学用生成式AI实现3D空间环境人机交互
... Synthesis/可控人-物交互合成),而它采用最新的条件扩散模型技术来产生无缝和精确的交互,比如“把桌子举过头顶,走路,放下桌子”。展望未来,以后的虚拟生物将可以像人类一样流畅地理解和响应语言命令,而系统可以从...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...其坚定信心及历史使命。 以下为访谈实录:建立 “世界模型”触发机器人 “灵性”问:被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向,引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多
...的中关村展示中心开幕。全球首个低碳单体稠密万亿语言模型,全球领先真机实验成功率突破95%的泛化抓取技术,能反思、可随机应变的铰接物体操作大模型系统、全球首个智能心脏超声机器人……作为专注于人工智能的北京新...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
最近的大模型行业,似乎有一种「暴风雨来临前的平静」。整个 8 月,OpenAI 连续不断的行动似乎在告诉我们:风向要变了。从发布 System Card,开放大模型微调能力,再到针对逻辑能力改进,可个性化训练部署的「草莓」模型,...……更多
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,OpenAI忘记机器人了吗?「甲子光年」在2023北京...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
...造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、社会治理与服务等重大应用需求。今年以来,具身智能正在成为学术界和产业界的热门领域,相关的产品和成果层出不穷。今天,...……更多
大语言模型如何宣告心理学的死亡?
...的本质。但随着人工智能技术的飞速发展,特别是大语言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。AI不再只是技术进步的象征,它已经开始挑战我们对心理学——甚至是我们对智能本身——的传统理解。人工智能...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...的通用形态;也有部分公司的研究侧重于突破机器人全脑模型,希望赋能机器人,让其具备接受人类指令并规划拆解任务的通用决策能力。千诀科技是一家专注于机器人大模型研发的创业公司,希望研究出适配不同机器人设备形...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...动过程中不断促进自身“进化”。传统 AI 需要依靠内置模型对世界进行表征,再根据这些表征建构行为概念,这种模式高度依赖人工数据标注,不仅缺乏应对多变情况的灵活性,也无法理解与任务相关的未标注因素。由于传统 A...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...tificial Intelligence)进入人们视野。在这一概念下,借助大模型,机器人感知、决策与交互提升,具备更强的自主学习能力和环境适应性。机器人赋予大模型现实的物理载体,让曾经的虚拟智能走进现实世界。技术和现实的交织足...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...al Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。目光转回国内,我们同样在中国公司中发现了这场变革浪潮的先行者。据机器之心了解,国内初创公司自变量机器人(X Square),是国内唯一...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更有颠覆性的是国内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,...……更多
更多关于科技的资讯:
AI 音频领域的“瑞士军刀”:英伟达推出Fugatto,音乐制作新神器
IT之家 11 月 26 日消息,英伟达昨日(11 月 25 日)发布博文,宣布推出音乐生成 AI 模型 Fugatto
2024-11-27 09:41:00
极摩客 EVO-X1 迷你主机开售:AI 9 HX 370 + 32G + 1T,5299 元
IT之家 11 月 26 日消息,极摩客 EVO X1“进化者”迷你主机现已在京东开售,该机采用“AMD 锐龙 AI 9 HX 370 + 32GB RAM + 1TB 存储空间”规格
2024-11-27 09:41:00
微软 Xbox 虚拟形象编辑器将于明年 1 月 9 日停止服务
IT之家 11 月 26 日消息,微软 Xbox 官网日前更新了一则公告,Xbox 和 PC 平台的 Xbox Avatar Editor 虚拟形象编辑应用将于 2025 年 1 月 9 日停止服务
2024-11-27 09:41:00
中国科大在触觉传感器研究中取得重要进展
IT之家 11 月 26 日消息,中国科学技术大学工程科学学院、人形机器人研究院董二宝副教授课题组联合香港城市大学于欣格副教授团队
2024-11-27 09:43:00
魅族 PANDAER 35W 自带线移动电源「旷野」配色上市,165 元
IT之家 11 月 26 日消息,魅族 PANDAER 35W 自带线移动电源今日官宣推出全新配色「旷野」,该款移动电源额定容量 10000mAh(37Wh)
2024-11-27 09:43:00
特斯拉得州工厂被曝排放有毒污染物长达数月,员工被要求撒谎
IT之家 11 月 26 日消息,特斯拉美国得州总部被曝污染问题,排放有毒污染物长达数月。《华尔街日报》11 月 24 日援引特斯拉高管与得克萨斯州监管机构之间的电子邮件
2024-11-27 09:45:00
三星 Galaxy S25 Ultra 手机真机首曝:边角更圆润、边框更窄
IT之家 11 月 26 日消息,消息源 u / ChemicalAir2655 昨日在 Reddit 社区发帖,分享了一段三星 Galaxy S25 Ultra 手机的实物视频
2024-11-27 09:45:00
颠覆认知:新研究表明身体细胞也有“记忆”
IT之家 11 月 26 日消息,我们一直以为记忆是大脑的专属功能,但一项发表在《自然通讯》杂志上的最新研究彻底颠覆了这一认知
2024-11-27 09:48:00
2K 启动器正式停用,Steam 及 Epic 等平台游戏可直接打开游玩
IT之家 11 月 26 日消息,2K Games 官方宣布,旗下 2K 启动器已从 Steam 和 Epic 平台完全停用
2024-11-27 09:49:00
realme 真我 GT7 Pro 手机即日起至 11 月 29 日限时 12 期免息
IT之家 11 月 26 日消息,真我手机官方今日发文宣布,GT7 Pro 机型即日起至 11 月 29 日开启 12 期限时免息活动
2024-11-27 09:49:00
微信支持多人发送相同文件只存一次,格式变化会被认为文件不同
IT之家 11 月 26 日消息,腾讯 WXG(微信事业群)员工 @客村小蒋 在 11 月 24 日回复了网友关于微信是否会重复保存同一个文件的问题
2024-11-27 09:50:00
英特尔酝酿关键微码更新,将修复提升 Arrow Lake 处理器性能
IT之家 11 月 26 日消息,科技媒体 WccfTech 昨日(11 月 25 日)发布博文,报道称英特尔正酝酿新的 CPU 微码(Microcode)更新
2024-11-27 09:51:00
小米 REDMI K80 Pro 冠军版手机亮相,再度联名兰博基尼汽车
IT之家 11 月 27 日消息,小米今日公布了 REDMI K80 Pro 冠军版手机的外观,包括黑色、绿色两个后盖版本
2024-11-27 09:52:00
游戏性能提高最多 13.23%,华擎 Z890 主板获推英特尔 PPM 驱动
IT之家 11 月 26 日消息,华擎昨日宣布已在官网为旗下 Z890 系列主板发布英特尔 PPM(Platform Power Management)驱动程序
2024-11-27 09:52:00
吴恩达开源大模型套件:11个模型平台一种方式调用,半天获1.2k星
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200+星标(同步更新时已有1.8k)。它把11家知名大模型平台集中到了一起
2024-11-27 09:56:00