• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
...升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易理解的语言,大大提升工作效率。天镜大模型SQL生成平台不再需要代码等指令,也不需要专业的数据洞察,可...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
首个!成都造人形机器人“贡嘎一号”来了
...于扩散架构人形机器人任务生成式模型”,“国内首个多模态人形机器人任务执行系统”等30余项世界领先的人形机器人“大脑”核心技术成果,填补多项国内空白。“贡嘎一号”(Konka-1)作为首台植入创新中心“最强大脑”的...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
“抢位”人工智能新赛道
...的补助●增强人工智能大模型开放创新。鼓励企业开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,且性能达到国内领先的通用大模型,按照模型研发成本的30%,给予牵头研制企业最高3000万元的补助...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
千亿级神经元数字孪生脑平台在沪发布,为治疗抑郁症等打开思路
...器人领域发布了全球首个具备动态双目立体视觉和视听多模态控制的机器头脑,满足机器在未知环境下自主移动及人机协作应用需求。千亿级神经元数字孪生脑平台以复杂的人脑为原型,实现了人脑全尺度千亿级神经元功能的精...……更多
更多关于科技的资讯:
新华社杭州8月3日电 大模型、人形机器人、智能计算等领域科技频频突破,以杭州“六小龙”为代表的人工智能科创企业拔地而起……今年以来
2025-08-04 07:19:00
7年前的iPhone,凭什么被炒成千元神机
跳票N年的苹果首款折叠屏iPhone,终于又有了点眉目。近日,继折叠屏iPhone“将于2025年三季度末或四季度初投产”的传言后
2025-08-03 17:09:00
生产未动、订单先行!仰华汽车科技四大产业基地即将落地贵州
8月1日,仰华汽车科技在贵阳经开区举行发布会,会上与香港投资机构完成投资交接、与海外企业签下首批国际订单,意味着总投资超三十亿的汽车项目离落地贵阳更近了一步
2025-08-03 18:02:00
闪铸科技AD5M连续12月蝉联亚马逊销冠,中国3D打印品牌闪耀全球
在竞争激烈的全球3D打印市场中,中国品牌闪铸科技(Flashforge)凭借强劲的研发实力与持续创新力,再次刷新国际成绩单
2025-08-03 18:33:00
准大学生成为十堰数码市场消费主力军
十堰广电讯(全媒体记者 魏俊 何旭)高考结束后,相关消费持续升温,准大学生拉动“后高考经济”,带动手机、电脑等入学装备销量激增
2025-08-03 19:01:00
网易云音乐独家打造BLACKPINK快闪空间 出道九周年庆典同步开启
2025年8月2日,全球顶级艺人BLACKPINK官宣入驻网易云音乐,并通过独家中文笔记向平台乐迷分享了最新动态。YG娱乐联合CASTER STAR
2025-08-03 15:23:00
物业公司打起来了,一边撤场一边“抢地盘”
现在围绕物业问题产生的冲突越来越多。物业公司一边主动从一些小区“撤场”,引发行业对规模化增长和利润的担心,一边又发力在存量小区“拓盘”
2025-08-03 08:47:00
中国品牌出海,如何在不确定中锚定“确定”?2025出海大会嘉宾超级金句来了!
2025年7月25日, 2025出海大会在浙江钱塘成功举办。本届大会以「以“匠心”至“世界”」为主题,特设主会场及分会场“投资金砖”-国别合作对接会
2025-08-03 08:49:00
录取比例超过20比1,全球学霸为何千里迢迢来西湖“追星”?
这个暑假,西湖大学的校园里掀起一股特殊的“追星潮”——数百名来自全球多个国家和地区的青年学子,跨越山海奔赴杭州,只为近距离接触生命科学
2025-08-03 08:47:00
年入558亿,中国便利店之王,竟然是它
提起便利店大家脑海中出现的第一个名字是什么?罗森、7-11还是全家,可能每个人的答案都不一样。但如果是广东的朋友,那么答案一定是#美宜佳
2025-08-03 05:41:00
运动品牌营销细分,潮流基因强化圈层认同|世研消费指数品牌榜Vol.56
本次监测周期内,安踏、耐克和斐乐以1.86、1.70、1.68的综合热度位列榜单综合热度前三。图源:世研大消费指数国货运动品牌场景痛点精准拆解
2025-08-03 05:41:00
最没存在感的河北特产,悄悄统治江浙沪?
提到河北衡水,估计不少人脑子里先冒出来的,是让全国学生闻风丧胆的衡水中学,以及一瓶名叫老白干的白酒。但在这两张耀眼名片外
2025-08-03 06:43:00
华立工业园:制造企业落脚海外的“工业唐人街”
过去一百多年来,唐人街是中国移民在海外聚居形成的经济和文化社区,往往也是新移民踏上陌生土地后落脚的第一站。对于许多刚刚“走出去”的中国制造企业
2025-08-03 06:43:00
对话蚂蚁集团张俊杰:AI 如何重塑医疗健康产业?
当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理
2025-08-03 06:45:00
让机器人拥有智能触觉,「悟通感控」获数千万元融资 | 36氪独家
36氪获悉,柔性触觉感知科技公司「悟通感控」近日完成数千万元系列融资:Pre-A轮由尚势资本领投、水木创投跟投;Pre-A+轮由广发基金瑞元资本领投
2025-08-03 06:45:00