• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
亮相CES 成都高新区企业推出基于终端侧生成式AI人形机器人
...人名为“通天晓”,是全球首台完全基于高通SoC的端侧多模态AI大模型人形机器人,以其卓越的自主智能交互能力,成为了展会上的明星。据悉,“通天晓”(UltraMagnus)是成都高新区企业阿加犀智能科技有限公司(以下简称“...……更多
...升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易理解的语言,大大提升工作效率。天镜大模型SQL生成平台不再需要代码等指令,也不需要专业的数据洞察,可...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
首个!成都造人形机器人“贡嘎一号”来了
...于扩散架构人形机器人任务生成式模型”,“国内首个多模态人形机器人任务执行系统”等30余项世界领先的人形机器人“大脑”核心技术成果,填补多项国内空白。“贡嘎一号”(Konka-1)作为首台植入创新中心“最强大脑”的...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
“抢位”人工智能新赛道
...的补助●增强人工智能大模型开放创新。鼓励企业开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,且性能达到国内领先的通用大模型,按照模型研发成本的30%,给予牵头研制企业最高3000万元的补助...……更多
智机启新程,锐智引未来——成都市“智机新篇 锐智领航”机器人产业创新成果发布大会暨成都世运会智能制造应用场景推介会圆满落幕
...散架构的人形机器人高速推理模型R-DDIRM和首个机器人多模态模型RRMM,“鸿鹄”能够实现外界信息多维度感知、抽象语义精准解读、任务路径快速规划等功能,将成为工业生产中的智能先锋、家庭生活中的全能助手,为众多应用...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
更多关于科技的资讯:
多方恶意抢注DeepSeek商标被驳回:一公司疯狂抢注54次
快科技2月24日消息,今日,国家知识产权局发布通告,依法驳回抢注“DEEPSEEK”等相关商标注册申请。通告指出,近期
2025-02-24 23:03:00
夜神!小米15 Ultra影像脱胎换骨:升级巨大
本周有一场令无数人期待的“超高端”发布会即将来临!今日雷军在其微博官宣了小米“双Ultra”发布会定于2月27日晚上7点震撼登场
2025-02-24 23:03:00
倒计时3天!小米汽车宣布将在SU7 Ultra发布会前关闭小定通道
快科技2月24日消息,小米汽车即将在2月27日晚7点举行小米SU7 Ultra的发布会,并宣布届时将关闭小订通道。雷军此前在微博表示
2025-02-24 21:03:00
号称能缓解高血压!老人2万买治疗仪竟把自己电到头疼
2月24日消息,据媒体报道,一位陈姓老人称,他花费19300元购买了一台高电位治疗仪,销售称这台仪器可以缓解高血压、糖尿病
2025-02-24 21:03:00
时评 | 从演出经济看城市的“流量密码”
一场演唱会带火一座城,一场音乐节激活一片海……2月22日,除了连唱三天的“张学友60+”巡回演唱会外,汽水音乐海边派对也在海口同时上演
2025-02-24 21:23:00
iPhone 17系列外观引发争议!苹果设计师太激进
近日,爆料者Majin Bu在社交平台上公布了据称是iPhone 17系列的CAD设计图,揭示了苹果即将推出的新机型的一些关键设计细节
2025-02-24 21:33:00
这才是真正的生产力工具!OPPO Find N5远控Mac实测
移动办公早已不是什么新鲜事。随着移动办公的普及,全球近9亿人群正从传统办公模式逐步向移动化、智能化转型。尤其是2025年
2025-02-24 21:33:00
胎儿全身发白 竞因给妈妈“倒输血”:病例罕见
2月24日消息,据媒体报道,一位妈妈遭遇罕见的胎母输血综合征,腹中胎儿持续“倒输血”给母亲。孩子出生后,其皮肤非常白,可能有严重贫血
2025-02-24 21:33:00
为原生鸿蒙而生 华为首款新形态手机到底会是什么样
在春节前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东向外界透露了一个重磅消息,他表示华为会在3月份发布一款打破常规
2025-02-24 21:33:00
深圳一企业员工如厕须带“离岗证”:每次不超过7分钟
2月24日消息,据媒体报道,有网友反映,他之前就职的深圳一家公司限制员工上厕所的时间和次数。该网友称,这家公司要求每个员工4小时只能去2次
2025-02-24 21:33:00
深圳机场加快拓展人工智能全场景应用
本文转自:人民网人民网深圳2月24日电 (王星)近日,深圳机场在深圳市国资委指导下,完成人工智能大模型“Deep Seek R1”本地化部署
2025-02-24 21:45:00
曝小米15 Ultra将于3月18日在印度发布,小米15首当其冲沦为百元机
之前,小米官方就已经对外预告过,小米15系列,其中涵盖了全新的小米15Ultra,将会在3月2日的MWC2025上进行全球范围的发布
2025-02-24 21:47:00
博主称iPhone 17和16几乎没有区别,iPhone 15沦为千元机改写历史
近日,有博主指出,单从外观以及材质这两方面来看的话,iPhone17和iPhone16之间好像并没有太大的差别,它们在工艺以及内部结构方面都颇为相似
2025-02-24 21:47:00
曝华为今年独占技术很多,Pura70现感人价花粉直呼亮瞎眼!
有一位数码博主发布文章透露了相关消息,称华为在今年所拥有的独占技术数量比较多,甚至比之前预期的还要更多一些。按照相关爆料信息来看
2025-02-24 21:48:00
博主:厂商想要学华为得花大成本,Mate60价比千元机遭疯抢!
每当华为推出新机的时候,总是能够为大家带来令人眼前一亮的新技术。就拿去年来说,Mate70系列搭载了业界首发的红枫原生影像技术
2025-02-24 21:48:00