• 我的订阅
  • 科技

赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键

类别:科技 发布时间:2024-12-04 09:56:00 来源:财联社

《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。

“用户只需要输入一段描述,即可生成视频,”腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。企业用户通过腾讯云提供服务接入,目前API同步开放内测申请。

赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键

自从OpenAI 的Sora 基于 DiT(Diffusion Transformer)架构,把长视频生成的效果提高到了前所未有的水平,全球AI厂商加速赶来,掀起视频生成热潮。

2024年接近尾声,今年以来大模型领域最热闹的细分赛道要数视频生成。字节豆包正在推出文生视频内测,Minmax,快手,商汤等也先后推出了文生视频。由清华大学联合生数科技共同研发Vidu 则宣称是中国首个长时长、高一致性、高动态性视频大模型。

不过,做好文生视频这件事并不简单,这一点从OpenAI在今年初发布了Sora之后,仍未正式对外开放便可见一斑。

这主要是因为当前的视频生成技术产出的结果与用户期望之间仍存在较大差距,这些模型在理解和应用物理规则方面表现不足,并且在生成过程中缺乏有效的可控性。

按照腾讯的说法,混元文生视频大模型主要的优势能力在于,可以实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形。

“比如,在冲浪、跳舞等大幅度运动画面的生成中,腾讯混元可以生成非常流畅、合理的运动镜头,物体不易出现变形;光影反射基本符合物理规律,在镜面或者照镜子场景中,可以做到镜面内外动作一致。同时,模型还可以实现在画面主角保持不变的情况下自动切镜头,这是业界大部分模型所不具备的能力。”

从技术角度来看,据腾讯混元相关负责人介绍,混元大模型基于跟Sora类似的DiT架构,在架构设计上进行了多处升级。

混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现;采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角镜头切换;通过先进的图像视频混合VAE(3D 变分编码器),让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。

不过在视频生成领域,快手、抖音、智谱科技、生数科技等国内厂商均已推出相应的产品,甚至开启了商业化,腾讯混元此番的节奏并不算快。

对此,腾讯混元相关负责人在接受《科创板日报》记者采访时回应称,当下的视频生成技术,从可用度而言,还未到大规模商用的阶段,还有很多技术难点需要克服,混元大模型文生视频功能也并不急于一时,当下阶段更重要的是开源让更多人用起来,使模型的飞轮能快速转动带动优化模型本身。

在落地应用上,上述负责人表示,混元大模型生成的视频可用于工业级商业场景,例如广告宣传、动画制作、创意视频生成等场景。对于未来的商业化,腾讯暂时还没有详细的规划出来。

目前,腾讯宣布开源该视频生成大模型已在 Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-04 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧
...技术表现相对“佛系”的快手。6月7日,快手突然上线了文生视频模型“可灵”(Kling),并可支持长达2分钟的视频生成。此外,与Sora至今仍在“期货”阶段相比,可灵一经公布便
2024-08-01 09:32:00
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Vide
2024-12-04 09:49:00
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网络梗应用清影生成的视频 )。2024年过半,经过一轮“价格战”后,各
2024-07-27 14:18:00
Sora冲击波 抢人“饭碗”促生新职业?
2月19日,春节后第一个交易日,Sora相关概念(文生视频)股集体走高,会畅通讯、C易点、当虹科技、因赛集团、万兴科技20CM涨停,华扬联众、新国脉、新华网涨停封板。在文生视频的
2024-03-02 09:59:00
文博会观察:大模型为文化产业发展提供新机遇
...和产品。这些为文化产业发展带来新机遇。广告公司利用文生图技术,将图片生成技术用于素材生成,提升内容制作效率……在文博会腾讯展区,腾讯混元文生图大模型吸引了众多观众前来互动。“
2024-05-26 20:39:00
OpenAI“断供”,谁才是最大赢家
...型。 需要注意的是,它也是业内首个中文原生的DiT架构文生图开源模型,可供企业与个人开发者免费商用。为了提高大模型运行效率
2024-07-01 11:42:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源
2024-12-04 09:48:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...一款电动汽车Apple CarPika联手北大斯坦福发表论文,开源文生图框架大模型第一线微软组建新团队来造更轻且便宜的AI模型1月23日
2024-01-29 09:34:00
本文转自:四川日报竞逐文生视频新赛道——这家川企如何出海抢市场川企大调研调研企业成都恒图科技有限责任公司调研时间3月下旬调研主题川企如何竞逐文生视频新赛道□四川日报全媒体记者 史
2024-03-28 06:40:00
更多关于科技的资讯:
海信发布璀璨大冻梨冰箱 以“真大冷冻”新标准破解行业用户痛点
鲁网2月2日讯1月31日,海信正式推出全新产品——海信璀璨大冻梨冰箱。这款被定义为“行业大冷冻冰箱开创者”的产品,旨在系统性解决中国家庭在食材冷冻存储中长期面临的容积不足
2026-02-02 14:17:00
深挖用户痛点:海信璀璨大冻梨冰箱背后的“冻力”革命与创新哲学
鲁网2月2日讯中国家庭的冷冻室正面临一场普遍的“存储危机”:食材堆积导致存取不便;大量囤货时中心温度难以下降;化冻后的肉类口感干柴
2026-02-02 14:18:00
产业一线|每天翻开200次,折叠屏手机能用多久?
中新经纬1月29日电 (李自曼)“目前柔性OLED(有机发光二极管,是一种显示技术,被誉为第三代显示技术)屏,已经可以广泛应用在内折
2026-02-02 14:41:00
日前,在2026年美国气象学会年会上,英伟达正式推出Earth-2开放模型系列——面向人工智能气象领域的全开放、加速型模型与工具套件
2026-02-02 14:52:00
2026年1月30日,全球服务机器人行业领导者科沃斯(603486.SH)发布了2025年度业绩预告。预计2025年净利润17—18亿元
2026-02-02 14:53:00
AI赋能精准破局,绵阳开启高校毕业生高质量就业新路径
“以前写简历总抓不住重点,面试应答也缺乏逻辑。参加集训营后,我用AI工具精准生成了针对性简历和面试话术,还制作了个性化职业照和个人介绍短片
2026-02-02 14:54:00
没有什么比开业更优惠!三联家电章丘世茂店盛大试营业,全场5折起!
鲁网2月2日讯没有什么比开业更优惠!正值年货节消费旺季,三联家电作为国补以旧换新指定参与卖场,对个人消费者购买1级能效或水效标准的冰箱
2026-02-02 15:27:00
近日,多家媒体报道的“凌晨点外卖次数过多银行卡被风控”事件,让银行客户权益、风控安全之间的平衡问题再次受到关注。不少网友分享了类似经历
2026-02-02 16:27:00
AI OPC专区产业服务平台正式上线,助力无锡打造AI创新高地
近日,“智序·新征程—AI起航·预见未来”无锡市人工智能行业协会年度生态大会在无锡国际会议中心隆重举行。大会汇聚政府领导
2026-02-02 15:58:00
多彩贵州网讯 今年以来,都匀市税务局依托黔南州云税匀办税费集约中心持续拓展“线上主动服务”的应用场景,不断推动税费服务从“解答问题”向“解决问题”深刻转变
2026-02-02 16:10:00
零中断、零感知切换——泰安联通肥城分公司高效完成远端机房撤并实现降本增效与网络升级双突破
鲁网2月2日讯近日,在肥城城区的两个角落——交通局沿街6楼机房与上海世纪城基站,泰安联通肥城分公司组织网络综合支撑网格的10名技术骨干
2026-02-02 11:23:00
邮储银行精准滴灌 临沂商城春潮涌动
鲁网2月2日讯 (记者 吴艳萍 通讯员 李洁)新春将至,年味渐浓,作为全国规模最大的市场集群之一,临沂小商品城处处涌动着蓬勃生机与繁忙气息
2026-02-02 11:23:00
千问APP投入30亿 启动春节请客计划
2月2日,千问APP宣布投入30亿启动“春节请客计划”,以免单形式请全国人民在春节期间吃喝玩乐,感受AI时代的全新生活方式
2026-02-02 11:44:00
机器人的下一站:新华社记者张扬对话王兴兴
王兴兴称通用机器人一定可以实现“通用型机器人在我们这代人身上是能实现的,快点的话,十年间就是翻天覆地的变化。”在宇树科技创始人王兴兴看来
2026-02-02 12:56:00
集装箱卡车“混行”井然有序 厦门港海润码头上线水平运输智能调度系统
操作人员通过屏幕实时查看设备调度情况。(通讯员 林鸿涛 摄)厦门网讯(厦门日报记者 林桂桢)1月29日,走进厦门港海润码头的中控指挥台
2026-02-02 08:29:00