• 我的订阅
  • 头条热搜
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言。南都记者关注到,应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...西7月26日报道,今天一早,大模型独角兽智谱AI正式发布视频生成工具清影,可支持文生、图生6秒时长的视频,即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。先来看看效果,以下是几个官方放出的文生和图生...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
智象多模态生成大模型3.0版发布
...主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创始人兼CEO梅涛介绍,具体包括画面质量与相关性提升、镜头运动和画面运动更加可控,以及多场景驱动优化。当天,智象未来还发布了智象...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次登场,立刻带动了国内AI行业对视频、音频、图像、3D等多模态生成技术的探索。目前,生数科技自研的多模态通用大模型,已经初步具备短视频的生成...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...如生成一段吉他弹奏的音乐,还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成(来源:arXiv) 近日,相关论文以《M2Ugen:借助大型语言模型的力量进行多模态音乐理解和生成》(M2Ugen...……更多
...京2月26日电 (焦磊)只需输入文本指令,便可生成60s的视频内容,并在画面效果、视频时长、流畅度和逻辑性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明显优势,其他开放评测的文生视频模型中,国产模型PixVerse表现优异。由于安全与价值观对齐是模型产业落地的...……更多
连发两款模型“补课”,百度AI成色如何?
...PT-4.5。在具体能力方面,文心4.5支持文字、图片、音频、视频等多模态内容的上传和理解,相较文心4.0-Turbo新增视频、语音输入和联网搜索功能(网页版)。 百度还首次推出深度推理模型文心X1。虽然相较OpenAI发布o1已经过去半...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...全可以按照类似路线往前走。“第一步就是做海量的图片视频的预训练,实现predict next frame(预测下一帧),这样生成出来的视频会比Sora的效果要好很多;再加上指令遵循,视觉任务就完成了大一统。”在AI应用方面,阶跃星辰...……更多
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...。包括参数量300亿,可直接生成204帧、540P分辨率高质量视频的视频生成模型Step-Video-T2V,以及能根据不同场景生成情绪、方言、语种、歌声和个性化风格,和用户自然地高质量对话的语音交互大模型Step-Audio。 阶跃星辰创始人、...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...价值」 ?一句话、30 秒,创意立刻「活了」 。Vidu 文生视频一句话,召唤出 3D 世界。哇嘶嗒(VAST)文生3D模型一个创意、一键生成,短短五分钟,一段品牌宣传片便能完美呈现。手机,也能来个「即圈即搜」 。贵阳市民早高峰...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似?视频链接:https://mp.weixin.qq.com/s/3UuumW-tSvR86dhO6UQ-Mg提示词:火山喷发,升起巨大蘑菇云,岩浆顺着山体往下流,镜头拉近,岩浆正在火山口跳动冒出。这段 10 秒...……更多
李彦宏:百度坚决地对旗下各个产品线进行AI原生的重构
...生成能力上,文心一言除了生成文字内容,还包括图片、视频、数字人等等多模态内容,可实现的创作体裁超过200种,你让他写一首李白风格的诗,写出来就像李白,你让他写一首杜甫风格的诗,写出来就像杜甫,涵盖了几乎所...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...发展迎来里程碑Gemini1.0具有原生多模态的能力,能够处理视频、音频、图像、文本、代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。据谷歌介绍,Gemini不仅可以进行双模态之间的转换,也能处理需要进行多...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
在AI视频生成领域,要让视频人物和声音完美同步,仍是一个巨大的挑战。EMO不仅可以生成任意时长的说话视频,还能生成人像整个头部都发生丰富变化的说话视频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...合在 AI 顶会 IJCAI2024 上发起举办,探讨如何利用文本、音视频等多模态数据来进行 AI 情感识别,并推动相关技术在真实人机交互场景中的落地应用。大赛官网:https://zeroqiaoba.github.io/MER2024-website/#organization本届挑战赛共……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区中是独一无二的。它填补了现有框架仅支持单一模态或少数模态对齐的空白,为全模态大模型的对齐提供了统一和通...……更多
...模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...雷海波、AI绘画知名博主娜乌斯嘉三人,共同就《AI生成视频往何处去?》分享精彩观点,英诺天使基金合伙人王晟为本次对话主理人。 易子立首先教授表示,随着AI热潮的来临,很多企业已经在尝试使用AI工具,但文生图、文生...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
...网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60秒的视频。对比先前推出的视频生成模型,Sora在视频一致性等方面取得巨大进步,视频内容供给有望迅速增加。国盛证券认为,AI文生视频是多...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力超越Suno。用户仅需上传相册中的一张图片或一段不超过60秒的视频,即可生成与图像内容和基调高度适配的带人声唱词的完整歌曲,生成...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...、琼宇、大医、小浣熊家族等产品均有重要更新。“文生视频”已在路上,商汤科技坚定迈向AGI时代在本次技术交流日最后环节,商汤科技董事长兼CEO徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、...……更多
更多关于科技的资讯:
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00
北京上班族李想称,健身私教课结束后,教练为索要好评,直接拿他手机代笔修改达3分钟。好评既影响消费者选择,也关联平台推流与服务者收益
2025-12-03 13:41:00
找“搭子” 聊技术 谈合作每日商报讯 一个多星期前,“魔搭社区”(杭州)开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间
2025-12-03 13:41:00