• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
...升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易理解的语言,大大提升工作效率。天镜大模型SQL生成平台不再需要代码等指令,也不需要专业的数据洞察,可...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
首个!成都造人形机器人“贡嘎一号”来了
...于扩散架构人形机器人任务生成式模型”,“国内首个多模态人形机器人任务执行系统”等30余项世界领先的人形机器人“大脑”核心技术成果,填补多项国内空白。“贡嘎一号”(Konka-1)作为首台植入创新中心“最强大脑”的...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
“抢位”人工智能新赛道
...的补助●增强人工智能大模型开放创新。鼓励企业开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,且性能达到国内领先的通用大模型,按照模型研发成本的30%,给予牵头研制企业最高3000万元的补助...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
千亿级神经元数字孪生脑平台在沪发布,为治疗抑郁症等打开思路
...器人领域发布了全球首个具备动态双目立体视觉和视听多模态控制的机器头脑,满足机器在未知环境下自主移动及人机协作应用需求。千亿级神经元数字孪生脑平台以复杂的人脑为原型,实现了人脑全尺度千亿级神经元功能的精...……更多
更多关于科技的资讯:
骁龙8至尊版被榨干了!一加13性能实测
2024年10月31日,一加正式发布了其年度旗舰手机——一加13。作为一加品牌新十年的旗舰大作,一加13在性能、设计、屏幕
2024-11-05 23:09:00
三只羊总部深夜灯火通明:有主播靠直播三只羊总部涨粉数十万
11月5日消息,据媒体报道,有记者探访了位于合肥高新区的三只羊总部,晚上的时候这里灯火通明。在三只羊总部附近,部分主播以直播三只羊总部为主
2024-11-05 23:09:00
MacBook Pro 2026年重磅升级:OLED屏+轻薄机身
MacBook Pro系列有望在2026年迎来一次“革命性升级”,这一变革将主要体现在屏幕的革新与机身设计的轻薄化上。具体而言
2024-11-05 23:39:00
iPhone 16 Pro变飞船上太空!网友吐槽苹果最新广告:看的尴尬症犯了
快科技11月6日消息,日前,Apple官方抖音发布iPhone 16 Pro广告片,主题是介绍苹果A18 Pro芯片的神经网络引擎
2024-11-06 00:09:00
小鹏汽车CEO何小鹏晒大学照 中分发型配曼联球衣
11月5日,小鹏汽车CEO何小鹏分享了自己在大学时期的旧照片,照片中的他梳着中分发型,身穿曼联球衣,面容青涩。他表示,回到母校华南理工大学进行彩排
2024-11-06 00:09:00
岚图CEO卢放:国外大厂拆车研究岚图追光 产品力已远超BBA
快科技11月5日消息,岚图CEO卢放今晚发布视频称,岚图追光的产品力已经远超BBA。卢放表示,之前有很多国外大厂,拆车研究岚图汽车
2024-11-06 00:09:00
小米汽车智驾更新速度太快 官方揭秘背后运作机制
快科技11月6日消息,小米汽车官微带来了新一期微博问答,在这期问答中,小米揭秘了“小米汽车智驾如何实现快速迭代更新”。官方表示
2024-11-06 00:09:00
看完懂车帝的30款车“安全大碰撞” 我们到底该喷谁
这两天,脖子哥全在刷短视频了。吃饭刷,摸鱼刷,上厕所时候还在刷。吸引我的不是哪个漂亮妹子,而是懂车帝的碰撞小视频,一个接一个推给我
2024-11-06 00:39:00
用一星期变漂亮!董明珠示范9800元格力美容仪用法
快科技11月6日消息,日前,格力电器董事长董明珠和新东方创始人俞敏洪进行了一场合体直播,期间参观了格力工厂,聊到创新研发等话题
2024-11-06 00:39:00
极智嘉携手英特尔发布全球首款纯视觉机器人方案
11月5日消息,极智嘉(Geek+)昨日(11月4日)宣布,携手英特尔发布全球首款搭载英特尔视觉导航模块的纯视觉机器人方案
2024-11-06 01:39:00
《最终幻想7:重生》ps5pro主机增强版试玩视频发布
11月5日消息,索尼官方发布博文,宣布PlayStation5Pro主机11月7日首发支持55款游戏,SquareEnix工作室今日也发布了游戏《最终幻想7
2024-11-06 02:40:00
特斯拉推送2024.44更新,升级盲区警示系统
11月5日消息,据NotaTeslaApp报道,特斯拉近期向员工推送了2024.44更新,升级了其车辆的盲区警示系统,进一步提高了车辆的安全性
2024-11-06 02:47:00
2025款宝马m5旅行版正式投产,纯电续航40公里
11月5日消息,2025款宝马M5 旅行版已在宝马位于德国丁格芬的工厂正式投产,该车搭载了一套由4.4升V8双涡轮增压发动机和电动机组成的插电式混合动力系统
2024-11-06 02:48:00
东风本田和京东汽车签署战略合作协议,提升车主服务体验
11月5日消息,东风本田和京东汽车今日签署战略合作协议,宣布达成战略合作。未来,双方将在零售渠道、配件授权、整车销售、京东养车服务体系等方面展开深入合作
2024-11-06 02:52:00
五菱发布五菱之光纯电版官方图片
11月5日消息,五菱发布了五菱之光纯电版的最新官方图片,展现了这款全电动微面的多样化应用场景,涵盖了摆摊、货物运输、露营等多种功能
2024-11-06 02:53:00