视频,杜甫,生成,模型,模型,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

7月26日，智谱AI CEO张鹏在智谱Open Day上宣布，AI生成视频模型清影（Ying）正式上线智谱清言。南都记者关注到，应用清影生成6秒视频只需要30秒的时间，该功能不仅支持文生视频、图生视频，也支持视频生成视频（以下是利用网...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...西7月26日报道，今天一早，大模型独角兽智谱AI正式发布视频生成工具清影，可支持文生、图生6秒时长的视频，即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。先来看看效果，以下是几个官方放出的文生和图生...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

人工智能（AI）巨头OpenAI又出王炸，其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉，其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍，Sora是一种扩散模型...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

智象多模态生成大模型3.0版发布

...主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创始人兼CEO梅涛介绍，具体包括画面质量与相关性提升、镜头运动和画面运动更加可控，以及多场景驱动优化。当天，智象未来还发布了智象...……更多

2024-12-28 17:41:00模态,生成,模型,模态,模型,生成

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...是国内大语言模型狂飙的元年。2024年，OpenAI携可生成60秒视频的模型Sora再次登场，立刻带动了国内AI行业对视频、音频、图像、3D等多模态生成技术的探索。目前，生数科技自研的多模态通用大模型，已经初步具备短视频的生成...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月，我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司，往往只聚焦在...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

中信证券：OpenAI推出视频生成模型Sora AI产业围绕

中信证券：OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码【中信证券：OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电，中信证券研报指出，近一周内，OpenAI和谷歌分别推出了他们的最新AI模型，...……更多

2024-02-19 09:23:00中信证券,模态,中信,生成,模型,不断

“紫东太初”2.0问世可理解生成音乐和视频

...人工智能大模型“紫东太初”2.0问世可理解生成音乐和视频新华社北京6月16日电在三维场景里实现精准定位，通过图像与声音的结合完成场景分析……中科院自动化研究所16日发布“紫东太初”全模态大模型，并首次对外实...……更多

2023-06-17 07:40:00东太,生成,音乐,视频,模态,东太

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

智谱AI再次放大招，上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI，如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora，...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...如生成一段吉他弹奏的音乐，还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成（来源：arXiv）近日，相关论文以《M2Ugen：借助大型语言模型的力量进行多模态音乐理解和生成》（M2Ugen...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

拓宽行业应用场景多模态大模型加速通用AI进程

...京2月26日电（焦磊）只需输入文本指令，便可生成60s的视频内容，并在画面效果、视频时长、流畅度和逻辑性等方面具备惊人效果……近日，OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为，该项新产品或将促...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

智源评测体系发布国内外“百模”评估结果出炉

...文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上，对比各家公布的演示视频长度和质量，Sora有明显优势，其他开放评测的文生视频模型中，国产模型PixVerse表现优异。由于安全与价值观对齐是模型产业落地的...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

聚焦产业级多模态大模型研发，清华团队「生数科技」完成近亿元天

...很大，对用户意图、精确细节的把控有很大的欠缺，3D、视频等多模态的生成效果距离真正可商用也还有较大的距离，这意味着底层算法的迭代仍有较大的空间”。但渐渐产生变化的是算法和工程相结合的能力，即训练大模型的...……更多

2023-06-19 09:03:00模态,清华,融资,模型,团队,天使

连发两款模型“补课”，百度AI成色如何？

...PT-4.5。在具体能力方面，文心4.5支持文字、图片、音频、视频等多模态内容的上传和理解，相较文心4.0-Turbo新增视频、语音输入和联网搜索功能（网页版）。百度还首次推出深度推理模型文心X1。虽然相较OpenAI发布o1已经过去半...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...全可以按照类似路线往前走。“第一步就是做海量的图片视频的预训练，实现predict next frame（预测下一帧），这样生成出来的视频会比Sora的效果要好很多；再加上指令遵循，视觉任务就完成了大一统。”在AI应用方面，阶跃星辰...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

阶跃星辰宣布开源图生视频模型，多模态领域的DeepSeek时

...。包括参数量300亿，可直接生成204帧、540P分辨率高质量视频的视频生成模型Step-Video-T2V，以及能根据不同场景生成情绪、方言、语种、歌声和个性化风格，和用户自然地高质量对话的语音交互大模型Step-Audio。阶跃星辰创始人、...……更多

2025-02-22 16:36:00时来,模态,星辰,模型,时刻,领域

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

智东西12月3日报道，今天，腾讯混元大模型正式上线视频生成能力，这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍，此次更新中，HunYuan-Video模型经历了四项核心改进...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

百度文心一格总架构师肖欣延：历程坎坷但未来已至，大模型赋能智

...方式，带来行业发展的新机遇。肖欣延分别从图片生成与视频生成两个角度介绍了百度在大模型领域的成果：百度AI作画系统文心一格与基于文心大模型的视频创作系统，展示了AIGC强大的内容生成能力与发展潜能。在智能内容生...……更多

2023-05-26 15:52:00一格,文心,峰会,产业发展,颠覆,坎坷

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...价值」？一句话、30 秒，创意立刻「活了」。Vidu 文生视频一句话，召唤出 3D 世界。哇嘶嗒（VAST）文生3D模型一个创意、一键生成，短短五分钟，一段品牌宣传片便能完美呈现。手机，也能来个「即圈即搜」。贵阳市民早高峰...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

“紫东太初”：从多模态走向全模态

...在图书馆场景中；给出一张救护车图片、一段森林救火的视频和一段警笛音频，它也能准确识别并讲述一段完整的救援故事。6月16日，在人工智能框架生态峰会2023上，中国科学院自动化研究所所长徐波在发布“紫东太初”全模...……更多

2023-06-26 01:45:00模态,东太,模态,东太,模型,中国科学院

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...这八个字会在你的头脑中触发怎样的影像？是否与下面的视频类似？视频链接：https://mp.weixin.qq.com/s/3UuumW-tSvR86dhO6UQ-Mg提示词：火山喷发，升起巨大蘑菇云，岩浆顺着山体往下流，镜头拉近，岩浆正在火山口跳动冒出。这段 10 秒...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

“360智脑大模型4.0”正式发布，图片、文字、视频互相生成

...，包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。图片、文字、视频互相生成，接入360“全家桶” 时隔两个月，如今的“360智脑”已...……更多

2023-06-14 14:31:00接入,全家,生成,模型,文字,图片

李彦宏：百度坚决地对旗下各个产品线进行AI原生的重构

...生成能力上，文心一言除了生成文字内容，还包括图片、视频、数字人等等多模态内容，可实现的创作体裁超过200种，你让他写一首李白风格的诗，写出来就像李白，你让他写一首杜甫风格的诗，写出来就像杜甫，涵盖了几乎所...……更多

2023-11-15 15:32:00李彦,重构,产品线,旗下,产品,模型

专访HiDream.ai梅涛：视觉模型还未智能涌现，现在还有

...GPT-3。视觉基础模型包括和视觉相关的几个模态，图像、视频、3D这三种模态都在其中，所以也可以叫它多模态。当然，我们说的模态也是跨模态，可以从文字到图片，文字到视频、文字到3D甚至可以从图片到视频，或者是图片到...……更多

2023-06-25 10:53:00专访,模型,对话,视觉,一家,年度

Gemini引领多模态AI热潮，产业发展有望加速

...发展迎来里程碑Gemini1.0具有原生多模态的能力，能够处理视频、音频、图像、文本、代码等多种形式的内容，且性能优于现有的“拼接型”多模态大模型。据谷歌介绍，Gemini不仅可以进行双模态之间的转换，也能处理需要进行多...……更多

2023-12-11 15:01:00模态,热潮,产业发展,产业,发展,模态

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

...有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5，成为世界首个支持多主体一致性的多模态模型！上传小哥、机甲、街景，接下来，就是见证奇迹的时...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

Pika、阿里同日炫技！国产视频大模型奋起直追

在AI视频生成领域，要让视频人物和声音完美同步，仍是一个巨大的挑战。EMO不仅可以生成任意时长的说话视频，还能生成人像整个头部都发生丰富变化的说话视频，表情、五官、姿势都会产生非常自然的变化。在AI多模态领域...……更多

2024-03-01 09:26:00阿里,奋起,模型,国产,视频,视频

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...合在 AI 顶会 IJCAI2024 上发起举办，探讨如何利用文本、音视频等多模态数据来进行 AI 情感识别，并推动相关技术在真实人机交互场景中的落地应用。大赛官网：https://zeroqiaoba.github.io/MER2024-website/#organization本届挑战赛共……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型