模态,宝宝,模型,图像,训练,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...展现每一个动作的流畅过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...，公司的AI战略是以自主构建算力能力为底座，以开悟多模态大模型为支撑，通过中台体系的构建，实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

连发两款模型“补课”，百度AI成色如何？

...箱底的技术实力？按百度说法，文心4.5定位新一代原生多模态基础大模型，在多个基准测试中超过GPT-4o，得分最高的则是DocVQA，该基准主要测试文档图像的问答能力。在文本能力方面，文心4.5则在多个主流基准测试中超过DeepSeek-...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

北京人工智能数据运营平台发布

...大量通用数据、行业数据，支持文本、图像、视频等多种模态，并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练，同时，4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍，此次更新中，HunYuan-Video模型经历了四项核心改进：1、引入超大规模数据处理系统，提升视频画质；2、采用多模态大语言模型（MLLM），...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...布，“大杀器”Gemini 1.0，正式上线。Gemini是一个原生多模态大模型，谷歌在今年5月的I/O大会宣布开始研发后，Gemini的传说不断：将谷歌大脑和DeepMind部门合并，数百人攻坚，几乎耗尽谷歌内部计算资源……如此种种，只为和OpenA...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

建好AI训练“优质数据粮仓”｜贵阳大数据交易所发布939个高

...多样性和系统性——涵盖文字、音频、图片、视频等多种模态，以及TTS（文本转语音）、OCR（光学字符识别）等跨模态数据，使模型能够学习更复杂的语义关联，显著提升多轮对话、图像生成等任务的准确性，构建的“预训练集...……更多

2025-06-23 23:26:00数据,建好,贵阳,粮仓,交易所,高质量

昆仑万维SkyReels团队正式发布并开源SkyReels-

...fusion-forcing)框架的无限时长电影生成模型，其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。回顾过去……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...基于预训练GPT-2提出了一种新的注意力机制，来衔接不同模态之间的语义差异，无需大量图像-文本数据训练，就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造，基于新的编解码器架构C-V...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

2B多模态新SOTA！华科、华南理工发布Mini-Monke

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

苹果发布mm1.5-ui模型

10月13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

Meta推出AI新模型VFusion3D，微美全息布局AIG

...AI+ 3D模型受青睐自 ChatGPT 火爆全球，以支持图像输入的多模态大模型 GPT-4 的推出作为契机。大模型的多模态计算潜力开始在内容生成领域发挥技术优势，顶尖的科技公司和想要抓住 AIGC 风口的初创企业开始争先恐后地推出 AI 驱...……更多

2024-08-21 13:55:00全息,布局,模型,升级,产业,内容

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示

...7.21705项目地址：https://ali-videoai.github.io/tora_video/一、三种模态组合输入，精准控制运动轨迹Tora支持轨迹、文本、图像三种模态，或它们的组合输入，可对不同时长、宽高比和分辨率的视频内容进行动态精确控制。轨迹输入可以...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

...索（DeepSeek）又抛出新模型。1月28日，DeepSeek发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型

Gemini引领多模态AI热潮，产业发展有望加速

12月11日，多模态AI概念股继续活跃，苏州科达（603660.SH）三连板。截至当日中午收盘，因赛集团（300781.SZ）涨13.32%，苏州科达涨9.96%，宣亚国际（300612.SZ）涨9.7%。消息面上，GoogleAI大模型Gemini近日发布，Gemini是Google到目前为止规……更多

2023-12-11 15:01:00模态,热潮,产业发展,产业,发展,模态