高质量,生成,模型,文本,模型,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...同时提升生成质量。具体来说，Magic3D可以在40分钟内创建高质量3D网格模型，比DreamFusion快2倍，同时实现了更高分辨率，并在人类评估中以61.7%的比率超过DreamFusion。图像-文本模型生成主要代表作有Flamingo、VisualGPT。Flamingo 是Dee……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像

...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像，超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的？自回归通用文生图模型S...……更多

2024-06-27 09:17:00范式,仅需,高质量,生成,模型,图像

openai推出shap・e基于文本数秒内生成高质量3d模型

...els）的模型不同，可以生成具有细粒度纹理和复杂形状的高质量3D资产。OpenAI展示了Shap・E的结果，例如一碗食物，一只企鹅，一只体素化的狗，一个篝火，一把鳄梨形的椅子等。整个图片可以在几秒内完成渲染。附相关名词解...……更多

2023-05-09 21:48:00高质量,生成,模型,文本,模型,生成

Sora爆火96小时国内大模型进场

...频数据。OpenAI利用Dall-E 3中的标题生成技术，为视频生成高质量的文本标题，以此提高文本和视频数据之间的对齐度。在大规模训练过程中，Sora展示了一些“涌现的模拟能力”，如三维一致性、长距离连贯性、物体持久性以及与...……更多

2024-02-20 05:20:00模型,小时,视频,模型,生成,文本

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

...一个30B参数的Transformer模型，可以从单个文本提示，生成高质量的高清图像和视频，视频为1080P、16秒、每秒16帧。一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示，它就可以可控性生成和...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

火爆全球的AI音频大模型，最新技术细节揭秘

...模型，可免费生成长达47秒的样本和音效，还可生成44.1kHz高质量立体声音频，并且能在消费级GPU上运行。除了免费、开源，该模型还注重保护创作者版权，在数据训练中尽力避免伦理道德问题。论文透露，Stable Audio Open是StabilityA...……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球

智谱AI杀入视频生成：「清影」上线，时长6秒，免费不限量

...视频数据生成详细的、贴合内容的描述，进而构建海量的高质量视频文本对，使得训练出的模型指令遵循度高。最后值得一提的是，智谱 AI 自研了一个将文本、时间、空间融合起来的 transformer 架构，该架构没有采用传统 cross att...……更多

2024-07-27 09:27:00清影,时长,生成,视频,清影,视频

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...频生成： Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐，而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒，而且Meta还表示，它们的音频模型可以生成任意长度视频的连贯音频...……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...到视频生成模型CogVideo，采用了多帧率分层训练策略生成高质量的视频片段，提出一种基于递归插值的方法，逐步生成与每个子描述相对应的视频片段，并将这些视频片段逐层插值得到最终的视频片段。这个工作引起脸书、谷歌...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...为视频数据生成高度吻合的文本描述，进而构建了海量的高质量视频文本对，使得训练出的模型指令遵循度高。比如，输入指令“猴子打工”，可以看到智谱对“猴子”主体和“打工”行为理解都十分到位，生成了让打工人心酸...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

仅用4块GPU、不到3天训练出开源版GPT-4o，这是国内团

...型模型架构 ——LLaMA-Omni，它可以实现与 LLM 的低延迟、高质量交互。论文：https://arxiv.org/pdf/2409.06666 代码：https://github.com/ictnlp/LLaMA-Omni 模型：https://huggingface……更多

2024-09-24 13:42:00团队,训练,这是,研究,语音,文本

4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源

...用VAE进行解码以重建视频。数据视频生成模型训练需筛选高质量视频数据，以学习真实世界动态。但视频可能因人工编辑或拍摄问题而不准确。为此，团队开发了负面标签来识别和排除低质量视频，如过度编辑、运动不连贯、质...……更多

2024-08-07 09:43:00画质,电影,视频,模型,生成,团队

stability邀请用户测试文本到图像生成模型

...on3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试，不过已经启动了早期预览计划，用户可以访问该页面提交相关信息，加入等待名单，从而在正...……更多

2024-02-23 16:10:00生成,模型,图像,文本,测试,用户

Meta 公司发布 Imagine Yourself AI

...粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像，同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练的 CLIP 补丁编码器提取身份信息，并通过并行交叉注意模块将其与文本提示整...……更多

2024-08-24 09:44:00模型,公司,模型,生成,图像,身份

腾讯3D大模型全面开源，文本图像10秒转3D资产

...SOTA开源模型。用户喜好打分结果如下：Hunyuan3D-1.0在保证高质量、多样化生成之外，推理性能也大幅提升，显著减少了3D资产生产的耗时。“3D生成技术今年已进入快速发展阶段”推出Hunyuan3D-1.0的同时，腾讯混元3D大模型也正在落...……更多

2024-11-06 09:43:00腾讯,模型,图像,文本,资产,生成

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...确保每个子模型有效地从数据中学习并有助于整体性能。高质量合成数据混元团队开发了一套完整的高质量数据合成流程，主要包括四个步骤：指令生成、指令进化、回答生成和回答过滤。在指令生成阶段，混元团队使用高质量...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线

...只鹦鹉，极简，波西米亚风格”等描述，可图同样生成了高质量的精美AI图片。(根据文字描述生成的产品) 值得注意的是，“可图”大大降低了AI图像生成的使用门槛，提供了更好的使用体验：与同类产品需多张照片和较长时间...……更多

2024-05-31 17:41:00可图,快手,玩法,模型,图像,多种

Meta推出AI新模型VFusion3D，微美全息布局AIG

...3D生成式AI模型VFusion3D，能够从单张图像或文本描述生成高质量的3D对象，可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉，VFusion3D界面简单直观，允许用户自己上传或从一系列预加载的示例中选择图像，...……更多

2024-08-21 13:55:00全息,布局,模型,升级,产业,内容

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...重信息检索和摘要。通过人工标注精心生成了超过1100对高质量的长依赖问答对，以满足长依赖性要求。这些问答对经过了严格的交叉验证，从而得到了对大型语言模型（LLMs）长依赖能力的精确评估。LooGLE基准数据集仅包含2022年...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

大语言模型，实现智能客服知识库自动扩写功能

...板的动态框架，利用多轮迭代不断优化和改进，最终实现高质量的知识扩展。知识点扩充的技能也可以用于实现相似问句的自动生成。实现方法可以包括：构建知识图谱：收集与给定知识点相关的所有信息，构建知识图谱，包括...……更多

2023-05-06 19:00:00知识库,模型,语言,功能,智能,知识

重磅！国产AI写作模型比ChatGPT强1000%，360前

...说，只需要在输入框内输入创作需求，就可一键生成一篇高质量的长文本内容，超过当前市场上的所有热门AI写作产品。更重要的是，这不是简单粗暴的数字堆砌，而是去除了“AI味”的结构完整、逻辑清晰、深度专业的内容。...……更多

2024-09-20 13:35:00重磅,模型,团队,国产,员工,突破

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...避免仅只有原始词条。知识图谱的结构化特性有助于生成高质量指令，通过逻辑拆解和语义关系合成提升大语言模型的自然语言理解和推理能力。此外，指令的合成和语义对齐使小参数量模型达到接近或超越更大参数模型的效果...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...于为视频数据生成高度吻合的文本描述，进而构建了海量高质量视频文本对，提升了指令遵循度。清影的第三个特点是内容连贯性，能够比较好地还原物理世界当中的一些运动的过程。例如基于这张大家熟悉的杜甫画作，清影让...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

2023 的人工智能之年

...下载。Mixtral 8x7B：Mistral AI 还推出了 Mixtral 8x7B，这是一个高质量的稀疏专家混合模型（SMoE），拥有开放权重和总计 46.7B 的参数，代表了在提高真实性和减少偏见方面模型开放性的新阶段。Yi-34B llm：今年估值达到 10 亿美元，李...……更多

2023-12-29 05:02:00之年,人工智能,人工,智能,生成,人工智能

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...笔！正如其名字一样，Sana能以惊人速度合成高分辨率、高质量，且具有强文本-图像对其能力的模型。而且，它还能高效生成高达4096×4096像素的图像。项目主页：https://nvlabs.github.io/Sana/论文地址：https://arxiv.org/abs/2410.10629……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

...模块，基于此构建了 Charades-FIG、DiDeMo-FIG 和 ActivityNet-FIG 高质量细粒度 VCMR 基准，以推动细粒度 VCMR 研究发展。图 1：a) 粗粒度 VCMR 中，因查询文本简单，存在许多潜在正匹配（绿色），但这些时刻未被标注，导致真实标注不合...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模