• 我的订阅
  • 头条热搜
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...实物理世界,还拥有丰富的想象力,具备多镜头生成、时空一致性高等特性。从演示视频中可以看出,Vidu视频生成的效果达到了较高水平,例如在生成的游泳的柯基视频中,Vidu对柯基游泳时腿上毛发漂浮的细节处理得较为精细。而在4...……更多
“3D视频版Sora”来了!
...够同时生成多个新视图视频,大大提高了空间和时间轴的一致性。此外,该方法还可以实现更轻量的4D优化框架,而无需使用多个扩散模型进行繁琐的分数蒸馏采样。与其他方法相比,SV4D能够生成更多样的多视图视频,且更加细...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...效率更高、计算成本更低、并且在时间维度保持连续性和一致性。有网友对此总结道,在质量和文本对齐上,人类评估都强烈倾向于流匹配,而不是扩散。此外,Movie Gen Video在技术上也引入了很多创新:他们引入了创新的位置编...……更多
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
...符合用户的视觉效果。最后,LTX Video 实现了无缝的跨帧一致性,从角色到环境,可以保持连贯的视觉效果,将每个细节整合在一起。未来,LTX-Video 还会有技术报告放出。 ……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能...……更多
...科技正式发布视频大模型Vidu,这是我国首个长时长、高一致性、高动态性视频大模型,支持一键生成长达16秒、分辨率高达1080P的高清视频内容,目前正在加速迭代提升。此外,北京智源人工智能研究院与中国电信人工智能研究...……更多
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...强器(Temporal Feature Booster, TFB)-- 增强了潜在特征的时间一致性。 FancyVideo 训练流程FancyVideo 整体训练 Pipeline 如下所示。其中在模型结构方面,FancyVideo 选择在 2D T2I 模型基础上插入时序层和基于 CTGM……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...,还可以提升驾驶前景(车辆)和背景(车道线)的时空一致性。 DriveDreamer4D 的总体结构框图如下所示,轨迹生成模块(NTGM)用于调整原始轨迹动作,如转向角度和速度,以生成新的轨迹。这些新轨迹为提取结构化信息(如车...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...原生转场,可实现了多个镜头间的自然切换,并保持主体一致性。最后,HunYuan-Video采用了自研的3D VAE架构,以提升图像和视频重建的能力,特别在小人脸和大幅运动场景下表现更加流畅。 2、六大微调领域强化定向能力在预训...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...之间的高保真度,同时实现丰富的运动强度和良好的时间一致性。项目主页:https://atomo-video.github.io/2、EasyAnimate-v3:单张图像+文本生成高分辨率长视频EasyAnimate是阿里在4月12日推出的视频生成处理流程,并在短短3个月内迭代到v3...……更多
失意职场人 迷上了烧钱做短视频
...个核心:在AI生成的不确定内容中,为了保持人物角色的一致性和故事连贯,要不断抽卡。可灵在10月底开始内测人脸模型,用户上传一些关于同一人物的动作/表情视频,每段视频10-15s左右,就能训练出这个人物的数字人,之后...……更多
2024外滩大会展示AI应用新成果:机器人能自动烹饪、提供情感陪伴、仿生手可以手随心动……
...4秒长的视频仅需30秒, 分辨率最高可达 1080P,具有主体一致性和角色一致性的优势,拥有动漫风格、文字与特效画面生成等能力。“我们(的产品)是4月底发布的,7月底上线的。”上述工作人员表示,除了收获一批普通用户使...……更多
业绩预告不及预期,游戏和微盘股均出现持续预期下调
...大模型Lumiere,通过全新STUNet架构使AI生成视频时长和内容一致性得到突破性提升,使用户能够编辑、修复视频,或通过文本、图像生成视频。其框架由基本模型和空间超分辨率(SSR)模型组成,能够为每种空间风格创造性地匹配...……更多
Sora冲击波
...表达,而文生视频则需要在连续的时间序列中保持场景的一致性、物体的动态关系和光影的变化,这要求模型具备更强的时空建模能力和更高的计算复杂度。因此,文生视频技术的成功对于推动AGI的发展具有更为显著的作用。 ...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独具特色的亮点。前些天,豆包视频生成模型刚发布时,机器之心已经受邀进...……更多
自动驾驶领域 Sora大有可为
...容时长,更重要是它能支持多角色,并保持场景、角色的一致性;切换视频视觉与镜头;一定程度遵循真实世界的客观规律,包括光影变化、水流变化等。然而,Sora撼动的不仅是视频、影视行业,还有汽车领域,大模型本身就...……更多
【聚焦·科博会】走进“超高清视听科技展”,零距离感受超高清前沿黑科技
...工智能AIGC大放异彩生数科技展示了国内首个长时长、高一致性、高动态性的视频大模型-Vidu。该模型支持一键生成长达32秒的视频,实现了音视频合成以及从单一视频生成时空一致的4D内容的能力。这是全球范围内继 Sora之后,全...……更多
...生成时长增长难度指数级上升,更长的视频意味着更高的一致性要求、更详细的画面描述,对算力的消耗也是远超此前水平的。“没钱,没卡,没人才,差距在拉大。”谈及当下的真实感受,上述业内人士做了这样一句概括,在...……更多
第三届美图影像节发布6款产品 开启“AI工作流”新阶段
...的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。今年2月,文生视频模型Sora发布,并引发文生视频领域的竞争。但美图在实践过程中发现,用类似的文生视频...……更多
视频大模型Vidu发布3个月后正式全球上线 记者实测
...频和图生视频两大基础功能外,Vidu上线动漫风格和角色一致性两大新功能。 其中,动漫风格选项不仅保持动漫风格的一致性,还提高了画面的稳定性,避免了其他视频生成工具“动漫化”时常见的画面跳变和风格突变等问题。...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...。首先从官方评估结果看,混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先。然后从目前公开资料看,腾讯混元视频生成模型还有三个亮点。1、文本编码器部分,已经适配多模态大模型当下行业中...……更多
全面AIGC时代,豆包模型家族准备好了
...在技术层面全新的扩散模型训练方法攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,可10秒讲述一个起承转合的故事。在一个prompt的多个镜头切换时,保持主体,风格,氛围和逻辑的一致...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...保真度:生成的视频与输入图像在细节与风格上保持高度一致性运动一致性:视频动作流畅,确保时间上的一致性,不会出现突兀的跳转视频帧预测:通过迭代预测后续帧的方式,支持长视频序列的生成兼容性:与现有的多种文...……更多
AI视频新战场:字节对决快手、反击Sora
...语言能力,灵活控制视角,同时保持主体、风格和氛围的一致性。画质上,大模型支持包括黑白、3D 动画、2D 动画、国画等多种风格,包含1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配于各种终端,以及电影、手机竖屏等不同画...……更多
「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
...特定的物体细节,提供灵活多样的视角操控能力。c) 几何一致性:模型可支持长序列新视角的生成,保持前后帧视图的几何一致性,并遵循真实三维几何的物理规则。即使视角轨迹发生变化,返回时场景依然保持高逼真和一致性...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...模型生成的质量,更无法对生成视频的真实性、图文语义一致性等进行量化。因此,需要系统化构建针对文生视频模型的主观评价体系。该评价体系,由智源研究院与中国传媒大学基于双方在大模型评测领域和视频质量评价领域...……更多
A股震荡反弹,“短剧+游戏”商业模式有望延续
...主流app时长为10-14秒。首次多角度呈现人物,并保持长期一致性和对象持久性。生成的视频存在前后逻辑性(技术性突破)。首次支持视频生成视频,突破文字生成、图片生成视频限制。Sora的发布或将成为AI视频应用的里程碑事...……更多
AI视频两巨头开战!Runway秒生现实大片,Luma动嘴创作电影
...和视觉真实度方面实现了重大突破,甚至还能在保持风格一致性的同时,支持广泛的创意探索。借助Frames,任何人都可以为自己的项目确立独特的视觉风格、稳定生成符合审美的各种变体,最终精确地设计出所要创造的世界的外...……更多
字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点
...在审美、动幅上提升了一个 level,还破解了多主体互动和一致性难题。话不多说,先整几个视频让大家感受下:一位年轻女生微簇眉头,生气地戴上一副墨镜,这时,男主角入画,紧紧抱住了她。这段 10 秒的镜头中,人物面部...……更多
Sora概念引爆A股!谁在布局AI视频
...集团称,Sora基本解决了相对逼真模拟、角色和视觉风格一致性、运镜稳定性等技术难点,但依旧未攻克难以准确模拟复杂场景和行为交互、难以准确理解因果关系和空间细节等缺陷。展望未来,中国企业资本联盟副理事长柏文...……更多
更多关于科技的资讯:
全国首个万兆家庭云电竞PC在济南交付 开启云端游戏新场景
鲁网10月16日讯2025年10月13日,山东济南中铁逸都小区迎来全国通信与云游戏领域的一项重大突破——山东联通产互、济南联通联合华为完成全国首台万兆家庭云电竞PC的正式交付与开通
2025-10-16 11:58:00
□南京日报/紫金山新闻记者曹丽珍近期,金融机构2026年度秋季校园招聘大幕(以下简称秋招)开启。当前,金融行业数字化转型正在加速推进
2025-10-16 07:38:00
南报网讯(通讯员宁数轩记者马道军)10月15日,记者从市数据局了解到,由南京大数据集团牵头建设运营的南京数据要素创新中心——“宁数服”近日成功入选首批“江苏省数据产业公共示范平台”名单
2025-10-16 07:39:00
南报网讯(记者王国俊)10月13日,中国联通、中国移动、中国电信三大电信运营商相继官宣eSIM手机商用试验获批。昨天记者从南京相关运营商获悉
2025-10-16 07:39:00
千米产线“擀面皮” 火红钢坯变钢卷
以 “高智绿” 三重发力筑牢南京钢铁产业根基,探访梅钢热轧厂——千米产线“擀面皮” 火红钢坯变钢卷梅钢热轧产线厂房外景
2025-10-15 08:08:00
南报网讯(记者朱旖旎通讯员汪维)近日,栖霞区人工智能产业链新联会正式成立。这是我市首家聚焦于人工智能产业链的新联会,旨在搭建政企沟通桥梁
2025-10-15 08:08:00
厦门网讯(厦门日报记者 林露虹)10月16日—19日,2025厦门国际时尚周将在厦门中山路、鼓浪屿等文旅地标举行。本届时尚周以“自在发生”为主题
2025-10-15 08:21:00
河北日报讯(记者刘光昱)10月14日,为期3天的2025第十四届中国创新创业大赛新一代信息技术领域全国赛在雄安会展中心开赛
2025-10-15 08:24:00
“正大杯”2025年全球大学生就业创业实战大赛全国总决赛首轮赛事圆满收官
10月11日至13日,"正大杯"2025年全球大学生就业创业实战大赛全国总决赛首轮赛事在北京圆满举办。本届大赛以"创未来
2025-10-15 09:08:00
兴业银行“消保大模型智审平台”获评AIIA“2025年度人工智能金融专项优秀案例”
东南网龙岩10月14日讯(通讯员 肖夏玲)近日,在中国人工智能产业发展联盟(以下简称AIIA)、工业和信息化部新闻宣传中心
2025-10-15 09:40:00
京东11.11开场, 海外用户大件也包邮,收货更快更省
10月14日,京东11.11惊喜开放日在京举行。身处海外的华人用户,只需通过京东 APP 进入全球售平台,即可同步享受 “又好又便宜” 的购物体验
2025-10-15 09:45:00
锐志机械圆满收官PACK EXPO拉斯维加斯:聚焦纸袋包装的可持续发展
锐志机械圆满完成于9月29日至10月1日在拉斯维加斯举办的 PACK EXPO 参展工作。作为全球具有影响力的包装行业盛会之一
2025-10-15 10:08:00
百世软件推AI商品智能管理功能:一键上架,助力卖家高效出海
10月14日,百世集团旗下百世软件正式宣布,其面向海外市场的核心产品千易软件全新上线AI商品智能管理功能。该功能深度融合AI技术
2025-10-15 10:39:00
政府点单 企业接单 郑州航空港发布首批45个招商场景清单
大河网讯 近日,郑州航空港正式发布《郑州航空港区2025年第一批招商场景清单》,围绕十大产业集群系统性开放45个具体发展场景
2025-10-15 11:02:00
中国移动咪咕多部短剧获奖,闪耀2025视听中国马栏山微短剧之夜
2025年10月14日,“2025视听中国马栏山微短剧之夜”在湖南圆满落幕。此次活动由中国网络视听协会、湖南省广播电视局
2025-10-15 11:09:00