• 我的订阅
  • 头条热搜
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言。南都记者关注到,应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...西7月26日报道,今天一早,大模型独角兽智谱AI正式发布视频生成工具清影,可支持文生、图生6秒时长的视频,即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。先来看看效果,以下是几个官方放出的文生和图生...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
智象多模态生成大模型3.0版发布
...主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创始人兼CEO梅涛介绍,具体包括画面质量与相关性提升、镜头运动和画面运动更加可控,以及多场景驱动优化。当天,智象未来还发布了智象...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次登场,立刻带动了国内AI行业对视频、音频、图像、3D等多模态生成技术的探索。目前,生数科技自研的多模态通用大模型,已经初步具备短视频的生成...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
...人工智能大模型“紫东太初”2.0问世 可理解生成音乐和视频 新华社北京6月16日电 在三维场景里实现精准定位,通过图像与声音的结合完成场景分析……中科院自动化研究所16日发布“紫东太初”全模态大模型,并首次对外实...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...如生成一段吉他弹奏的音乐,还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成(来源:arXiv) 近日,相关论文以《M2Ugen:借助大型语言模型的力量进行多模态音乐理解和生成》(M2Ugen...……更多
...京2月26日电 (焦磊)只需输入文本指令,便可生成60s的视频内容,并在画面效果、视频时长、流畅度和逻辑性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明显优势,其他开放评测的文生视频模型中,国产模型PixVerse表现优异。由于安全与价值观对齐是模型产业落地的...……更多
...很大,对用户意图、精确细节的把控有很大的欠缺,3D、视频等多模态的生成效果距离真正可商用也还有较大的距离,这意味着底层算法的迭代仍有较大的空间”。但渐渐产生变化的是算法和工程相结合的能力,即训练大模型的...……更多
连发两款模型“补课”,百度AI成色如何?
...PT-4.5。在具体能力方面,文心4.5支持文字、图片、音频、视频等多模态内容的上传和理解,相较文心4.0-Turbo新增视频、语音输入和联网搜索功能(网页版)。 百度还首次推出深度推理模型文心X1。虽然相较OpenAI发布o1已经过去半...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...全可以按照类似路线往前走。“第一步就是做海量的图片视频的预训练,实现predict next frame(预测下一帧),这样生成出来的视频会比Sora的效果要好很多;再加上指令遵循,视觉任务就完成了大一统。”在AI应用方面,阶跃星辰...……更多
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...。包括参数量300亿,可直接生成204帧、540P分辨率高质量视频的视频生成模型Step-Video-T2V,以及能根据不同场景生成情绪、方言、语种、歌声和个性化风格,和用户自然地高质量对话的语音交互大模型Step-Audio。 阶跃星辰创始人、...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...方式,带来行业发展的新机遇。肖欣延分别从图片生成与视频生成两个角度介绍了百度在大模型领域的成果:百度AI作画系统文心一格与基于文心大模型的视频创作系统,展示了AIGC强大的内容生成能力与发展潜能。在智能内容生...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...价值」 ?一句话、30 秒,创意立刻「活了」 。Vidu 文生视频一句话,召唤出 3D 世界。哇嘶嗒(VAST)文生3D模型一个创意、一键生成,短短五分钟,一段品牌宣传片便能完美呈现。手机,也能来个「即圈即搜」 。贵阳市民早高峰...……更多
...在图书馆场景中;给出一张救护车图片、一段森林救火的视频和一段警笛音频,它也能准确识别并讲述一段完整的救援故事。6月16日,在人工智能框架生态峰会2023上,中国科学院自动化研究所所长徐波在发布“紫东太初”全模...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似?视频链接:https://mp.weixin.qq.com/s/3UuumW-tSvR86dhO6UQ-Mg提示词:火山喷发,升起巨大蘑菇云,岩浆顺着山体往下流,镜头拉近,岩浆正在火山口跳动冒出。这段 10 秒...……更多
“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶 | 最前线
...,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。图片、文字、视频互相生成,接入360“全家桶” 时隔两个月,如今的“360智脑”已...……更多
李彦宏:百度坚决地对旗下各个产品线进行AI原生的重构
...生成能力上,文心一言除了生成文字内容,还包括图片、视频、数字人等等多模态内容,可实现的创作体裁超过200种,你让他写一首李白风格的诗,写出来就像李白,你让他写一首杜甫风格的诗,写出来就像杜甫,涵盖了几乎所...……更多
专访HiDream.ai梅涛:视觉模型还未智能涌现,现在还有机会打造一家超越Midjourney的公司|年度AI对话
...GPT-3。视觉基础模型包括和视觉相关的几个模态,图像、视频、3D这三种模态都在其中,所以也可以叫它多模态。当然,我们说的模态也是跨模态,可以从文字到图片,文字到视频、文字到3D甚至可以从图片到视频,或者是图片到...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...发展迎来里程碑Gemini1.0具有原生多模态的能力,能够处理视频、音频、图像、文本、代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。据谷歌介绍,Gemini不仅可以进行双模态之间的转换,也能处理需要进行多...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
在AI视频生成领域,要让视频人物和声音完美同步,仍是一个巨大的挑战。EMO不仅可以生成任意时长的说话视频,还能生成人像整个头部都发生丰富变化的说话视频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...合在 AI 顶会 IJCAI2024 上发起举办,探讨如何利用文本、音视频等多模态数据来进行 AI 情感识别,并推动相关技术在真实人机交互场景中的落地应用。大赛官网:https://zeroqiaoba.github.io/MER2024-website/#organization本届挑战赛共……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区中是独一无二的。它填补了现有框架仅支持单一模态或少数模态对齐的空白,为全模态大模型的对齐提供了统一和通...……更多
...模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多...……更多
更多关于科技的资讯:
聚焦心理服务新生态:灵动生活集团旗下幸福研习社亮相第十九届中国心理学家大会
2025年8月8-10日,第十九届中国心理学家大会于深圳盛大启幕。本届大会紧扣“此心安处是吾乡—中国社会心理服务的文化归根与范式突围”主题
2025-08-13 15:45:00
校企联动,智绘未来:哈尔滨工程大学深圳校友企业联盟探访博大数据前海智算中心
近日,哈尔滨工程大学深圳校友企业联盟代表团探访博大数据深圳前海智算中心,近20家来自同行业以及相关领域的校友企业代表齐聚于此
2025-08-13 13:51:00
(摘要:守护权益,“链”动责任)供应链不仅是一种资源配置关系,更是企业责任延伸的重要载体,员工的权益保障与企业可持续发展紧密相连
2025-08-13 13:52:00
平度:国内外市场齐发力 泡菜产业蓬勃发展
大众网记者 尚超 尹璐瑶 青岛报道近日,在平度经开区青岛农一食品有限公司的生产车间,工人们熟练地操作着各类设备,从蔬菜清洗
2025-08-13 09:27:00
近期,我国在海南商业航天发射场使用长征十二号运载火箭,成功将卫星互联网低轨07组卫星发射升空。7月30日,我国在海南商业航天发射场使用长征八号甲运载火箭
2025-08-13 10:12:00
9月10日至14日,2025年服贸会将在首钢园举办,电信、计算机和信息服务专题展(服贸会ICT展)作为科技领域“排头兵”
2025-08-13 10:42:00
中国网8月13日讯据国家安全部,“旧手机、旧电脑换菜刀、换不锈钢盆喽!”这与时俱进又略带夸张的吆喝,您是否也曾听过?一些闲置的“电子家当”留着无用
2025-08-13 10:02:00
下一款全民级AI应用,可能是个老熟人
这是技术革命时刻,也是超车巨头的机遇。2025年年中,两个看似无关的消息,形成了有趣的对照。首先是8月8日,OpenAI夏季发布会举行
2025-08-13 07:01:00
何以中国·和合共生 撰稿:杨春文拍摄:刘岩、阎金勇制作:李辉监制:李华楠协助单位:天津杨柳青画社
2025-08-13 08:06:00
我市两项目入选省级首批实践案例点数成“金”,公共数据“跑”起来南报网讯(通讯员玄数轩建数萱记者邓露洁卫凌云)近日,省数据局在全国率先组织开展江苏省公共数据“跑起来”场景县(市
2025-08-13 07:45:00
东北雨姐账号将于10月解封,解封后可继续直播带货,名下关联5家公司3家已注销
近日,曾因虚假宣传被处罚的网红“东北雨姐”在社交平台更新动态,引发公众对其复出的猜测。8月11日,本溪满族自治县互联网信息办公室工作人员回应称
2025-08-12 12:08:00
当全球经济寒风凛冽,消费者的钱包愈发收紧,一个来自中国的新名字,却在海外电商版图上掀起了一场低价风暴——TEMU。它像一把利刃
2025-08-12 13:00:00
倍益康理疗机器人亮相2025世界机器人大会,探索理疗机器人新发展
8月8日,2025世界机器人大会在北京经济技术开发区北人亦创国际会展中心隆重举行。大会以“让机器人更智慧,让具身体更智能”为主题
2025-08-12 13:06:00
红松APP正式上线行业首个适老化艺术能力认证服务
近日,红松APP官宣正式启动银发艺术培训认证服务,上线行业首个面向银发人群的“艺术能力水平认证系统”。该服务由中国艺术职业教育学会培训中心(下称“培训中心”)联合红松集团共同打造
2025-08-12 13:08:00
开业未满五年 永辉超市池州远东国际店即将停业
大皖新闻讯 近日,永辉超市池州远东国际店发布停业公告,宣布该门店9月2日起正式停止营业,8月22日至9月1日期间将开展商品出清活动
2025-08-12 13:10:00