模态,感官,模型,体验,世界,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

meta开源多感官大模型，ai用6种模态体验虚拟世界

Meta最新 6模态大模型，让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子，听到闹铃声会想到闹钟，现在AI也可以。尽管画面中没有出现人类，AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多

2023-05-11 19:53:00模态,感官,模型,体验,世界,模态

多模态能力的进化，是AI眼镜成为生活必需品的关键

AI 浪潮下，多模态能力成为 AI 领域，特别是 AI 眼镜行业的高频热词。不少专家坚信，这项技术是突破单一交互局限的关键，有望重塑 AI 眼镜的使用体验。所谓多模态能力，即整合视觉、听觉、语言、触觉等多维度感官数据，...……更多

2025-04-08 17:49:00模态,生活必需品,必需品,进化,眼镜,关键

感官协同配合的精细操纵，人大胡迪团队探索机器人模态时变性挑战

...冯若轩为中国人民大学二年级硕士生，主要研究方向为多模态具身智能，师从胡迪教授。引言：在机器人操纵物体的过程中，不同传感器数据携带的噪声会对预测控制造成怎样的影响？中国人民大学高瓴人工智能学院 GeWu 实验室...……更多

2024-11-09 09:53:00胡迪,模态,感官,变性,机器人,团队

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

... AI 发起挑战的高规格赛事落下了帷幕！这就是第二届多模态情感识别挑战赛（MER24），它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

全模态对齐框架align-anything来啦：实现跨模态指

... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中，「有效加速」和「超级对齐」已经成为两个主要的发展动向，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...过半，经过一轮“价格战”后，各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点，大模型行业本身也正经历从单模态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日，商汤科技发布多模态多任务通用大模型“书生（INTERN）2.5”，在多模态多任务处理能力方面实现多项全新突破，其卓越的图文跨模态开放任务处理能力可...……更多

2023-03-15 13:30:00商汤,模态,书生,模型,任务,社区

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...这个金秋，“日日新·商量”又拿了金牌！今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。商...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...数字空间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

「千诀科技」推出通用感知大模型，专注机器人全脑研发｜早期项

...大产品突破。丘脑是一个多功能的脑区，用于将动物的多模态感官信息进行提取，传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站，它除了收发感官信息以外，还要对其进行一定的处理，包括压缩、解析以及调节生理...……更多

2023-12-26 19:41:00机器人,模型,机器,项目,科技,丘脑

拓宽行业应用场景多模态大模型加速通用AI进程

...业内分析认为，该项新产品或将促使大模型厂商加大对多模态大模型的研发投入，并进一步推动AGI（通用人工智能）进程。一直以来，视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后，Sora的发布迎合了...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...晨，美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂（Mira Murati）介绍，GPT-4o可以接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合进行...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

夸克AI超级框上新“拍照问夸克” 加码多模态能力

...应用，夸克AI超级框持续快速迭代，提升超级智能体的多模态能力，打造用户生活、工作、学习的AI超级入口。视觉交互创新，智能分析万物在工作、学习、生活各类场景中，面对复杂物体、表格和图形时，用户往往难以准确描...……更多

2025-04-27 13:22:00夸克,模态,能力,夸克,用户,模态

阶跃星辰宣布开源图生视频模型，多模态领域的DeepSeek时

...开源大模型DeepSeek走红，AI社区开发者也开始探讨，在多模态领域能否出现这样强大的模型。有着多模态领域深厚积累的阶跃星辰选择为开源贡献自己的力量，首次进行了模型开源。在大会期间，阶跃星辰与吉利联合宣布将双方...……更多

2025-02-22 16:36:00时来,模态,星辰,模型,时刻,领域

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

vivo蓝心大模型升级为“自研ai多模态大模型”

...432%。同时黄韬宣布，vivo的蓝心大模型升级为“自研AI多模态大模型”，这项技术通过视觉、声音、空间等多维度感知和理解世界，使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多

2024-05-15 04:08:00模型,模态,升级,黄韬,模型,多维度

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...导读】面壁小钢炮MiniCPM-V 2.6重磅出击，再次刷新端侧多模态天花板！凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠，连

...世界顶级赛事中，平安产险（参赛团队名称PA-VCG）在“多模态文档推理理解”这一高复杂度任务中，凭借领先的大模型技术体系与卓越的多模态理解能力，从全球众多顶尖科研机构与知名科技企业中脱颖而出，强势夺冠，连续4...……更多

2025-06-17 17:47:00模态,产险,国际,平安,顶尖,赛事

北京智源研究院发布原生多模态世界模型Emu3

...者刘峣）近日，北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成，成功验证了基于下一个token（词元）预测的多模态技术范式，释放其在大规模训练和推理上...……更多

2024-10-24 05:12:00模态,北京,研究院,模型,研究,世界

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

从智能中枢到超拟人助手：三星Galaxy S25系列揭示手机

...列给出了答案——通过超拟人化的AI助理Bixby和增强的多模态感知能力，重新定义手机的智能交互体验。当手机屏幕不再只是触控操作的载体，当语音助手能够理解图片和文档中的大千世界，让用户真正能够实现“一语多意图”...……更多

2025-02-12 12:19:00拟人,三星,中枢,形态,助手,智能

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...张鹏则表示，对于Sora的出现，他并不吃惊，因为立足多模态领域的深耕，智谱也正在做这件事。如今，“清影”面世，让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态，也让没有视频制作基础的小...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

紫东.太初再进化，揭秘全模态大模型的想象力

...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0，并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法：“在过去的几年里，好的多模态模型一直是许多大型技...……更多

2023-05-12 06:00:00太初,模态,想象力,进化,模型,模态

多模态AI午前大涨，游戏ETF半日涨幅近4%

今日午前，多模态AI题材午前崛起，Sora方向领涨，其中，游戏ETF（516010）和游戏ETF（159869）半日涨幅分别达到3.95%和3.93%，领涨整个ETF市场。投资逻辑方面，日前，谷歌发布了基础世界模型Genie，Genie是一个110亿参数的基础世界模...……更多

2024-03-16 23:35:00模态,涨幅,指数,影视,上市公司,动漫游戏

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...或者语音的交互。这促使我们思考：如何构建具有更丰富模态的3D自主角色呢?要实现这个目标，主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息，并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态