模态,山海,实时,生成,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示视频+10页技术报告解读

...7.21705项目地址：https://ali-videoai.github.io/tora_video/一、三种模态组合输入，精准控制运动轨迹Tora支持轨迹、文本、图像三种模态，或它们的组合输入，可对不同时长、宽高比和分辨率的视频内容进行动态精确控制。轨迹输入可以...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

豆包电脑版，原地封神了！

...工作流更加高效，也为日常学习带来了全新的方式。多模态能力：语音、图片、音乐一站搞定豆包电脑版在模态能力上的投入更是值得一提。有幸拿到了内测机会，提前试用了它的全新语音功能，让语音对话和练习变得更加流...……更多

2024-09-26 13:48:00封神,豆包,原地,电脑,豆包,电脑

刚刚！字节跳动豆包上线图片理解，大模型走向多模态｜钛媒体AG

（图片来源：林志佳拍摄）国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息，钛媒体AGI获悉，字节跳动豆包日前上线了一项实用功能——图片理解。目前，豆包APP及豆包PC新增照片及相机按钮，上传图片后可识别...……更多

2024-12-04 09:51:00模态,豆包,字节,模型,媒体,图片

发展新质生产力看山西国企：当煤炭遇上AI，安全培训也能脑洞大

...式。过去需要30天完成的复杂设备三维建模，如今借助多模态图像识别技术，仅需3天即可生成毫米级精度的数字模型。“这套实训模式最核心的地方是运用最新的AI图文生成及模型重塑技术。”郑云龙调出刮板运输机数字模型介...……更多

2025-04-21 14:30:00大开,山西,生产力,煤炭,生产,安全

腾讯大模型战略全景亮相！混元大模型、知识库、智能体开发平台一

...话AI体验。今年以来，混元的迭代速度明显加快。在多模态生成领域，混元图像 2.0 率先实现“毫秒级”生图，混元3D v2.5凭借业界首创的稀疏3D原生架构，实现了可控性与超高清生成能力的代际飞跃。凭借技术的领先性和开放的...……更多

2025-05-26 17:47:00全景,模型,好用,开发平台,腾讯,知识库

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...展现每一个动作的流畅过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

华为harmonyosnext重塑全新“星盾”安全架构

...的盘古大模型5.0版本，标志着人工智能技术在全系列、多模态、强思维三个方面的全新升级。盘古大模型5.0以其全系列的模型规格，为不同业务场景提供了定制化的解决方案。PanguE系列，拥有十亿级参数，专为手机、PC等端侧智...……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

RTX 40系GPU AI性能首测

...IAACE技术Demo，它突破了游戏中NPC角色互动的界限，采用多模态方法来展示NPC，将认知、感知和行为系统集成在一起，以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX，增加了更多的功能，在新版本中它加入...……更多

2024-05-04 17:17:00性能,生成,测试,创作,火星,图片

数字人说武汉、AI画建议两会现场注入科技“创新力”

...两会版数字人。武汉人工智能研究院大模型是全国产、全模态，除了语音、图像和文本，还可以识别视频、3D点云等模态数据，与长江日报联合开发武汉两会版3D数字人，进行大模型语料训练，更懂两会，更懂大武汉。代表委员...……更多

2024-01-17 04:46:00创新力,武汉,建议,数字,科技,武汉

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...），任意到任意则是更远的未来。任意到任意模型属于多模态到多模态，用户可以输入文本、语音、图像或视频等多种形式的内容，并相应地输出文本、语音、图像或视频。Vasi Philomin向我们解释说，任意到任意模型适用于变化...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

周鸿祎参演！“AI+影视”，即将爆发？

...可以用简单的自然语言和人进行交互，再到声音图像整个模态的生成，最后在视频创作方面的能力突破，今年有可能是“AI+影视”爆发的时期。AI声音合成技术，不仅适用于影视配音，还可用于有声书制作、播客创作、广告配音...……更多

2025-02-26 15:56:00周鸿,影视,短剧,剧本,创作,影视

江南观察|MCP协议赋能人机协同研究新机遇

...省精力，更加专注于核心任务创新。第二，实时感知，多模态协作。区别于传统API的“请求——响应”的交互方式，MCP协议允许服务器主动推送实时数据，这就可以让AI在未经过微调的情况下，更加准确的感知实时信息，降低大...……更多

2025-04-22 21:52:00江南,人机,新机,观察,研究,数据

矩阵起源入选IDC《RAG与向量数据库市场前景预测》报告

...原生HTAP数据库，支持包括向量数据、时序数据在内的多模态数据管理和检索能。MatrixOne不仅实现了向量类型、向量搜索和向量索引功能，还通过其MatrixGenesis产品提供大模型托管和多模态检索服务，为企业搭建一站式生成式AI应...……更多

2024-11-29 19:41:00向量,矩阵,起源,前景,数据库,报告

MediaTek发布天玑9300旗舰5G生成式AI 移动芯片

...型，完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用，为用户提供文字、图像、音乐等终端侧生成式AI创新体验。天玑9300率先采用新一代旗舰12核GPU Immortalis-G720，与上一代相比，峰值性能提升46%，相同性...……更多

2023-11-07 13:58:00启全,天玑,旗舰,芯片,生成,移动

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...个面向不同细分领域（视频生成、音乐和同声传译）的多模态大模型，同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀：豆包视...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走向Agent（智能体）。此...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...，公司的AI战略是以自主构建算力能力为底座，以开悟多模态大模型为支撑，通过中台体系的构建，实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

多模态AI午前大涨，游戏ETF半日涨幅近4%

今日午前，多模态AI题材午前崛起，Sora方向领涨，其中，游戏ETF（516010）和游戏ETF（159869）半日涨幅分别达到3.95%和3.93%，领涨整个ETF市场。投资逻辑方面，日前，谷歌发布了基础世界模型Genie，Genie是一个110亿参数的基础世界模...……更多

2024-03-16 23:35:00模态,涨幅,指数,影视,上市公司,动漫游戏

杭州科技企业为何集体押注大模型开源？

...单前三！阿里通义千问Qwen2.5-Omni凭“能看能听能说”的全模态能力登顶全球开源模型榜首，深度求索DeepSeek的V3-0324在代码生成上碾压GPT-4.5，群核科技的SpatialLM把三维空间认知玩出了花。如今，杭州已经成了全球范围内少有的，...……更多

2025-04-03 06:49:00杭州,模型,集体,科技,企业,模型

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝