• 我的订阅
  • 科技

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

类别:科技 发布时间:2024-10-22 09:49:00 来源:IT之家

IT之家 10 月 21 日消息,复旦大学和百度联合开发了一款名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造

Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。

此外,Hallo2 将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法,并通过文本提示进行增强。

IT之家附 Hallo2 项目地址如下:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-22 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

一文详解AIGC:忘记概念,只聊落地
...将视频进行剪辑和剪切,进行音频的音乐配合等。视频超分辨率及去噪:对视频信号进行去噪处理和超分辨率,以提高视频的视觉效果和品质。工具推荐及总结其实,刚才说的这些智能形式,并非所
2023-06-10 15:00:00
让霉霉说地道中文,背后玩家竟来自中国,7个月收入百万美元
...队协作和企业功能。来源:HeyGenHeyGen可以基本保证1080P的分辨率,满足广告、电商、新闻等行业的需求,还能帮助用户制作PPT
2023-10-23 19:41:00
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...计。而且,该模型有强大的适应性,可生成不同纵横比、分辨率和时长的高质量图像和视频。预训练阶段,在大约1亿个视频和10亿张图像上进行了联合预训练。它是通过「看」视频,来学习视觉
2024-10-08 09:52:00
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...建高质量3D网格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion
2023-01-30 16:34:00
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...时长最长可达16秒。该模型能够自然地生成多种纵横比、分辨率和时长的高质量图像和视频。模型通过联合预训练,处理约1亿个视频和约10亿张图像,通过“观看”视频来学习视觉世界。这只
2024-10-08 09:51:00
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...无论是效果、时长还是视频的真实性、稳定性、一致性、分辨率等方面,sora的能力都实在令人震惊!Sora 生成式AI新里程碑据介绍
2024-02-29 12:00:00
16小时超长续航!华硕无畏Pro14酷睿版2025轻薄本国补后只要4879元
...炫130T核显,配备7个Xe核心,最高频率2.2GHz,支持XeSS2超级分辨率、帧生成、低延迟技术。集成独立NPU AI引擎
2025-03-19 13:57:00
Camtasia2023试用版下载电脑屏幕录制软件
...络摄像头。网络摄像头让您的视频更具个性。媒体。导入分辨率高达4K的图像、音频和视频。注释。箭头、标注、形状等有助于表达您的观点。过渡。将介绍/结尾添加到片段、图像、形状或文本
2023-02-13 06:00:00
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
...定的视觉质量时往往牺牲运动动态效果,为了优先考虑高分辨率而限制视频时长(通常为5-10秒),并且由于通用多模态大语言模型(MLLM)无法解读电影语法(如镜头构图、演员表情和摄
2025-04-21 13:53:00
更多关于科技的资讯:
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00
厦门城市可信数据空间开放试运行推出“马上有数”进驻激励计划 首发5个月资源免费共享东南网2月11日讯 (海峡导报记者 康泽辉) 近日
2026-02-11 17:50:00
元梦空间荣膺两项大奖 闪耀2025人工智能未来设计大赛
2025年11月10日,由工业和信息化部工业文化发展中心主办的2025“人工智能未来设计大赛”全国总决赛在山西太原圆满落幕
2026-02-11 17:50:00
【寒假摘镜总动员】选择哪种近视手术方式?——济南普瑞眼科王晓雪主任为您专业解析
视力是体检中至关重要的一环。选择一种既安全稳定、又符合体检标准的近视手术方式,是实现梦想的关键一步。济南普瑞眼科作为山东省首批蔡司全飞秒4
2026-02-11 17:51:00
潮新闻讯 随着人工智能兴起,数据要素领域的生产性服务业,规模正迅速壮大。近日,浙江省委副书记、省长刘捷在杭州专题调研服务业发展工作
2026-02-11 17:58:00
俊小白与上海吴淞材料实验室联合成立实验室
中国消费者报北京讯(记者孙蔚)近日,上海吴淞材料实验室与国货科创口腔护理品牌俊小白联合成立的个人护理功能介孔材料联合实验室正式落成
2026-02-11 18:06:00
大皖新闻讯 大皖新闻记者从国先中心(合肥)了解到,日前,零次方机器人率先完成中国信通院“可信AI”具身智能基准测试(EAI Bench)
2026-02-11 18:18:00
2月5日,中国消费者协会公布了2025年全国消协组织受理投诉情况统计数据,去年全国消协组织共受理消费者投诉2016448件
2026-02-11 18:06:00
职场人年货买什么?食品类、数码类需求上升
日前,智联招聘发布《职场人春节生存图鉴调研报告》,呈现职场人在春节前后的工作状态、社交压力、休闲计划等。春节前后通常是离职高峰期
2026-02-11 19:14:00
2025年,安徽太和县烟草专卖局(营销部)紧扣行业高质量发展要求,以“强基固本、提质增效”为主线,深化终端现代化转型,在数字化赋能
2026-02-11 14:18:00
从技术到情感,2026值得入手的定制珠宝品牌,一文读懂不踩坑
一、定制珠宝为何成为新消费时代的“刚需”?过去几年,全球珠宝产业正经历一场由内而外的结构性重塑。根据《2026全球珠宝行业白皮书》披露的数据
2026-02-11 14:20:00
从稀缺神话到情感载体:纪派珠宝以科技与东方美学重塑钻石新价值
当钻石遇见东方智慧,情感与科技共舞的时代序章在消费升级与情感表达需求日益凸显的今天,珠宝早已超越其物质属性,成为承载记忆
2026-02-11 14:21:00
东航、迪士尼都来了!40多个旅行品牌推出“千问价”
“史上最长春节假期”即将开启,2月11日,千问APP联合飞猪宣布,与全球40多家旅行品牌达成AI合作,为通过千问购买飞猪机酒门票的用户提供专属优惠“千问价”
2026-02-11 15:18:00