• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
...升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易理解的语言,大大提升工作效率。天镜大模型SQL生成平台不再需要代码等指令,也不需要专业的数据洞察,可...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
“抢位”人工智能新赛道
...的补助●增强人工智能大模型开放创新。鼓励企业开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,且性能达到国内领先的通用大模型,按照模型研发成本的30%,给予牵头研制企业最高3000万元的补助...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
千亿级神经元数字孪生脑平台在沪发布,为治疗抑郁症等打开思路
...器人领域发布了全球首个具备动态双目立体视觉和视听多模态控制的机器头脑,满足机器在未知环境下自主移动及人机协作应用需求。千亿级神经元数字孪生脑平台以复杂的人脑为原型,实现了人脑全尺度千亿级神经元功能的精...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
更多关于科技的资讯:
接入中国天通卫星!三星Galaxy S25 Ultra国行版支持卫星通话
快科技2月12日消息,三星Galaxy S25系列国行版已经发布,售价5999元起。其中,超大杯的Galaxy S25 Ultra机型起售价为9699元
2025-02-12 00:19:00
雷军明天元宵节直播:邀大家共赏舞狮、猜灯谜
快科技2月11日消息,元宵佳节将至,雷军已经正式宣布,将于明天晚上7点开展一场别开生面的元宵节直播,与广大网友们一同欢度这个温馨团圆的节日
2025-02-12 00:19:00
是个车企都要蹭DeepSeek 属实有点幽默了
DeepSeek 的热度,终究还是被车圈蹭上了。就在这几天,当我们还在跟 DeepSeek 互喷服务器繁忙的时候, N 个国内的车企就跟商量好了似的
2025-02-12 00:19:00
美国法院判决腾讯视频胜诉:获赔6.16亿人民币
快科技2月12日消息,当地时间2月7日,美国德克萨斯州西部地区法院作出判决,支持腾讯公司对某电视盒子公司及其关联公司和下游美国销售商提起的影视剧版权侵权诉讼
2025-02-12 00:19:00
108名乘客落地印尼 行李还在广州!机场回应:地勤忘装了
快科技2月11日消息,据报道,有网友日前发视频爆料称,2月10日乘坐从广州飞往印度尼西亚雅加达的翎亚航空8B861次航班
2025-02-12 00:19:00
十五的月亮十五圆!今日元宵节:21时53分月亮最圆
快科技2月12日消息,今天是蛇年农历正月十五,是中国传统的元宵佳节,是一个阖家团圆的喜庆节日。天文科普专家表示,蛇年元宵节是“十五的月亮十五圆”
2025-02-12 00:49:00
小鹏自动泊车出bug 停到小区车库路中间致堵车
快科技2月11日消息,虽然当前不少车企都已推出了离车自动泊入的智能泊车系统,但在使用时还需要关注车辆动态,以免系统发生bug时闹出笑话
2025-02-12 00:49:00
有什么用 美国在洛杉矶最大水库中投放9600万个黑色小球
这些黑色小球有什么用?美国为什么要在洛杉矶最大水库中投放9600万个?这种小球是遮阳球!欧美国家很多储水的场所——包括水库
2025-02-12 00:49:00
新春企业开工忙(图)
2月6日,江西省吉安市万安县一科技有限公司数字化智能生产线上,机器设备正高效运转,工人们在各自岗位上忙碌,赶制电容式触摸屏、LCD显示模组、IPS液晶屏(LCM)等产品,冲刺新春
2025-02-12 04:48:00
“让机器人成为生活的好帮手”
本文转自:人民日报海外版从“草根”创新到全球领跑,再到产品走上春晚舞台,中国科创企业宇树科技定下目标——“让机器人成为生活的好帮手”本报记者 杨俊峰《人民日报海外版》(2025年
2025-02-12 05:26:00
本文转自:人民日报海外版本报记者 方 圆 本报通讯员 李双余《人民日报海外版》(2025年02月12日第 09 版)亚冬会的舞台
2025-02-12 05:26:00
本文转自:人民日报海外版《人民日报海外版》(2025年02月12日第 10 版)本报电(立风)日前,南方电网深圳供电局首个政企用联建高电能质量示范园区——广东深圳龙岗高新产业高电能质量示范园区正式建成
2025-02-12 05:26:00
本文转自:人民日报海外版《人民日报海外版》(2025年02月12日第 10 版)据新华社东京电(记者钱 铮)日本北海道大学
2025-02-12 05:26:00
本文转自:人民日报王云杉更好捕捉产业变革风向、抓住时代机遇,力促传统产业“老树发新芽”,新兴产业“独木成森林”,未来产业“小树快成长”浙江三门县一家水产育苗公司
2025-02-12 05:46:00
即时配送  “跑”向万亿元大市场(大数据观察)
本文转自:人民日报品类更广、时段更全、场景更多即时配送  “跑”向万亿元大市场(大数据观察)本报记者 韩 鑫图①:海南海口
2025-02-12 05:46:00