• 我的订阅
  • 科技

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

类别:科技 发布时间:2024-10-22 09:49:00 来源:IT之家

IT之家 10 月 21 日消息,复旦大学和百度联合开发了一款名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。

此外,Hallo2 将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法,并通过文本提示进行增强。

IT之家附 Hallo2 项目地址如下:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-22 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

一文详解AIGC:忘记概念,只聊落地
...将视频进行剪辑和剪切,进行音频的音乐配合等。视频超分辨率及去噪:对视频信号进行去噪处理和超分辨率,以提高视频的视觉效果和品质。工具推荐及总结其实,刚才说的这些智能形式,并非所
2023-06-10 15:00:00
让霉霉说地道中文,背后玩家竟来自中国,7个月收入百万美元
...队协作和企业功能。来源:HeyGenHeyGen可以基本保证1080P的分辨率,满足广告、电商、新闻等行业的需求,还能帮助用户制作PPT
2023-10-23 19:41:00
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...计。而且,该模型有强大的适应性,可生成不同纵横比、分辨率和时长的高质量图像和视频。预训练阶段,在大约1亿个视频和10亿张图像上进行了联合预训练。它是通过「看」视频,来学习视觉
2024-10-08 09:52:00
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...建高质量3D网格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion
2023-01-30 16:34:00
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...时长最长可达16秒。该模型能够自然地生成多种纵横比、分辨率和时长的高质量图像和视频。模型通过联合预训练,处理约1亿个视频和约10亿张图像,通过“观看”视频来学习视觉世界。这只
2024-10-08 09:51:00
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...无论是效果、时长还是视频的真实性、稳定性、一致性、分辨率等方面,sora的能力都实在令人震惊!Sora 生成式AI新里程碑据介绍
2024-02-29 12:00:00
16小时超长续航!华硕无畏Pro14酷睿版2025轻薄本国补后只要4879元
...炫130T核显,配备7个Xe核心,最高频率2.2GHz,支持XeSS2超级分辨率、帧生成、低延迟技术。集成独立NPU AI引擎
2025-03-19 13:57:00
Camtasia2023试用版下载电脑屏幕录制软件
...络摄像头。网络摄像头让您的视频更具个性。媒体。导入分辨率高达4K的图像、音频和视频。注释。箭头、标注、形状等有助于表达您的观点。过渡。将介绍/结尾添加到片段、图像、形状或文本
2023-02-13 06:00:00
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
...定的视觉质量时往往牺牲运动动态效果,为了优先考虑高分辨率而限制视频时长(通常为5-10秒),并且由于通用多模态大语言模型(MLLM)无法解读电影语法(如镜头构图、演员表情和摄
2025-04-21 13:53:00
更多关于科技的资讯:
合肥“机器人大学”新增“家庭课”:VR手把手教学,三个月“毕业”上岗
大皖新闻讯 家里乱了,谁来整理?这些日常家务,未来可能交给机器人。近日,合肥市具身智能机器人数据采集训练场在原有场景基础上
2026-01-08 18:05:00
三国何以“常青”?灵犀互娱发起游戏行业首个三国文化论坛
1月5日,中国游戏行业首个聚焦三国题材的文化论坛——“常青三国:重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办
2026-01-08 17:01:00
都匀佳速健诊所招新媒体运营 五险一金+弹性工作制
多彩贵州网讯(记者雷小露 裘金鉴) 为进一步扩大品牌影响力,推动科技医疗技术的广泛传播,都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名
2026-01-08 17:05:00
【宅男财经|专家面对面】中新经纬1月7日报道称,蔚来创始人、董事长李斌表示,汽车行业和AI行业都在抢铜、银等原材料,原材料涨价还没有传导到终端售价
2026-01-08 14:13:00
中新经纬1月8日电 (谢婧雯)8日,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股116.20港元。智谱开盘价报120港元/股
2026-01-08 14:13:00
记者昨日从中国科学院获悉,“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展,神舟二十一号航天员乘组共同在轨操作该项目实验
2026-01-08 15:08:00
上海晶珩ED-HMI3120:树莓派让工业控制可视化更简单
HMI3120工业人机界面是上海晶珩(EDATEC)最新推出的产品系列,内置树莓派CM5计算平台,融合了高性能处理能力
2026-01-08 15:23:00
26年深耕·千万青年共创:学院奖,链接青年力量与商业未来
当茅台王子酒的“王子音乐节”在高校掀起青春热潮,当可比克实践赛涌现出上千份青年创意实战方案,当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度
2026-01-08 15:25:00
确权破局护品牌,明远领航“大朴”启新程
随着国货家居品牌进入高质量发展阶段,维护品牌核心资产的唯一性已成为企业发展的重中之重。近日,家纺领军企业明远集团正式宣布
2026-01-08 15:26:00
百年守护 因AI而“声”动
2025年,故宫博物院迎来建院百年。 这一百年,是实物守护的百年——从战火中南迁万里护送国宝,到一代代匠人在红墙内对《五牛图》的精心修复
2026-01-08 16:39:00
你“点单”我“买单” 新书配送到家!蚌埠市图书馆“云借阅”受热捧
大皖新闻讯 无需舟车劳顿往返图书馆,只需轻点手机屏幕,崭新的图书便能免费配送到家。1月8日,大皖新闻记者从蚌埠市图书馆获悉
2026-01-08 15:45:00
ChatGPT跟进发布AI健康功能!国内“蚂蚁阿福”月活用户已达3000万
蚂蚁集团旗下“蚂蚁阿福”火爆之后,OpenAI也决定入局AI医疗健康领域。1月8日,OpenAI推出 ChatGPT Health功能
2026-01-08 11:26:00
中新经纬1月8日电 汇源集团发布声明称重新接管汇源品牌。8日,汇源官方微信号发文称,北京汇源食品饮料有限公司(以下简称“北京汇源”)重整一案
2026-01-08 11:58:00
大麦娱乐深度合作2026原神嘉年华,打造“逛展+旅游”一站式省心娱乐体验
日前,《原神》年度线下嘉年华——第三届“原神☆FES”在上海国家会展中心举办。项目独家票务平台大麦数据显示,这场为期4天的线下盛宴共吸引超8万人次奔赴
2026-01-08 13:27:00