• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
...升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易理解的语言,大大提升工作效率。天镜大模型SQL生成平台不再需要代码等指令,也不需要专业的数据洞察,可...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
首个!成都造人形机器人“贡嘎一号”来了
...于扩散架构人形机器人任务生成式模型”,“国内首个多模态人形机器人任务执行系统”等30余项世界领先的人形机器人“大脑”核心技术成果,填补多项国内空白。“贡嘎一号”(Konka-1)作为首台植入创新中心“最强大脑”的...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
“抢位”人工智能新赛道
...的补助●增强人工智能大模型开放创新。鼓励企业开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,且性能达到国内领先的通用大模型,按照模型研发成本的30%,给予牵头研制企业最高3000万元的补助...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
更多关于科技的资讯:
华为鸿蒙智行享界的商标曝光!
近日,CNMO注意到,华为技术有限公司在国家知识产权局商标局官网提交了鸿蒙智行享界的商标信息。据悉,该商标国际分类为12
2024-12-03 17:08:00
iqoo13正式登陆印度市场,支持120W有线快速充电
12月3日,iQOO印度举办新品发布会,旗下最新年度旗舰iQOO13系列正式登陆印度市场。iQOO印度举办新品发布会iQOO13搭载高通骁龙8至尊版移动平台
2024-12-03 17:11:00
本文转自:人民网-安徽频道11月29日,为期三天的中建一局五公司2024年度人工智能应用竞赛及青年突击队课题成果发布会在安徽合肥圆满落下帷幕
2024-12-03 17:15:00
理想汽车公布最新周销量排行榜,智界汽车首次上榜
12月3日,理想汽车发布2024年第48周(11.25-12.1)中国市场新势力品牌销量排行,智界汽车首次上榜进入前十
2024-12-03 17:16:00
海外媒体发稿:国外热门平台全览
一、海外媒体发稿的重要性在当今全球化的时代,海外媒体发稿对于企业而言具有至关重要的意义。首先,海外媒体发稿能够极大地提升信息覆盖面
2024-12-03 17:25:00
寒冷的冬天,你需要一个这样的取暖器
最近又降温了,从未来的天气预报来看,北方的冬天算是正式拉开帷幕。每到冬季,哈尔滨就成旅游热地,迎来了它一年中最迷人的季节
2024-12-03 17:37:00
华为Mate 70系列明日开售,何刚宣布直播首销盛况
12月3日,华为终端BG首席执行官何刚通过微博宣布,明天上午9:50,他会在华为旗舰店·深圳万象天地,直播华为Mate70系列的首销盛况
2024-12-03 17:49:00
鲁网12月3日讯近日,国家工信部公布了先进计算赋能新质生产力典型应用案例,泰安市出版印刷产业链重点企业——东平润声印务“智能印刷云平台”成功入围传统产业领域方向
2024-12-03 17:57:00
学者郑锋出版新作《工业品销售十堂课》
近日,山东省就业促进会副会长郑锋新作《工业品销售十堂课》由机械工业出版社出版。目前已在京东、当当等平台和全国各地书店陆续上架
2024-12-03 20:16:00
在零售行业风起云涌的今天,苏宁易购作为国内领先的零售服务商,其一举一动都牵动着市场的神经。近日,苏宁易购宣布了一项重要的人事任命——朱朝阳正式成为苏宁易购济南大区新任总经理
2024-12-03 20:52:00
文旅类综艺火爆,《狂想之城》探索城市文化
文|李振兴 于琪11月29日,随着互联网平台的文娱板块逐渐被“旅行纪实+深度访谈”形式的短综所刷屏,梅赛德斯-奔驰与建筑师马岩松共同携手
2024-12-03 20:53:00
“百城万店”计划推进中:乐刻运动门店数破1700家,称明年一季度有望达2000家
文|罗曾12月3日,中华网财经从乐刻运动方面了解到,目前其门店总数已突破1700店,进入国内超30个城市。其中近半年,乐刻在常州
2024-12-03 20:55:00
钱江观潮丨浙企攻破“卡脖子”技术斩获首张CMP抛光液订单
早上9时左右,敲开宁波润平电子材料有限公司董事长惠宏业的办公室时,他正接起当天的第5个电话。电话接二连三,有催订单的,也有谈业务
2024-12-03 21:00:00
好气网发布天然气能力认知大模型
图为发布现场。河北新闻网讯(记者刘杰)11月28日,在第三届好气节云聚会直播现场,由好气网打造的天然气能力认知大模型获重磅发布
2024-12-03 21:22:00
剑指国际户外大市场 上千家福建厂商借道跨境电商SHEIN出海“拼品牌”
历经40多年产业发展、闻名中外的“世界鞋服厂”的福建,如今涌现出许多新气象:当地鞋服厂争相做加法,加速完善上下游供应链配套
2024-12-03 21:34:00