• 我的订阅
  • 科技

视频生成群雄逐鹿,哪些重要问题待解?

类别:科技 发布时间:2024-11-26 09:38:00 来源:智东西
视频生成群雄逐鹿,哪些重要问题待解?

12月5-6日,2024中国生成式AI大会(上海站)「GenAICon 2024」将在上海中星铂尔曼大酒店盛大举办。中国生成式AI大会已成功举办两届,迅速成长为国内生成式AI领域最具影响力的产业峰会之一。

此次也是中国生成式AI大会首次登陆上海举办,由智一科技旗下智能产业第一媒体智东西、AI与硬科技知识分享社区智猩猩共同发起。上海市人工智能行业协会为本次大会的指导单位。

大会上海站以“智能跃进 创造无限”为主题,将设置“主会场峰会+分会场研讨会+展览区”。其中,主会场将进行大模型峰会、AI Infra峰会,分会场将组织端侧生成式AI、AI视频生成和具身智能三场技术研讨会。主会场与分会场外则设有展览区。

50+位嘉宾将在大会上带来致辞、演讲、报告和对话讨论,以前瞻性视角为大家解构和把脉生成式AI的技术产品创新、商业落地解法、未来趋势走向与前沿研究焦点。

作为大会上海站的三场技术研讨会之一,AI视频生成技术研讨会将在第二日上午的分会场进行,由主题报告和圆桌Panel两个环节组成。

Sora自年初问世以来,AI视频生成领域风起云涌,到年末来看,国内外都已是群雄逐鹿的局面。尽管如此,依旧有不少重要问题有待解决。目前,从学术界到工业界,都在致力于解决AI视频生成尚未解决的问题,以期为视频生成大模型及应用产品带来更优质的体验。

一、上海站三场研讨会之一,完整议程公布

目前,AI视频生成技术研讨会邀请到中存算董事长陈巍,上海交通大学人工智能研究院助理教授晏轶超,新壹科技AI算法主任架构师李璋,井英科技联合创始人、CTO王健,旷视研究院高级研究员李华东5位青年学者和技术专家带来报告,将围绕视频大模型架构比较、三维数字人视频生成、面向数字人生成的视频垂直大模型、AI短剧技术突破、可控人物视频生成展开讲解。

视频大模型(VLM)正与短视频产业结合并迎来新爆发点。中存算董事长陈巍将围绕《视频大模型架构对比及长序列模型加速》这一主题,从视频生成大模型与世界模型的视角出发,对比主流架构(如NaViT、RADM),探讨内存墙和通信墙对视频大模型GPGPU/TPU集群训练和部署的挑战,并分享算力芯片级训练部署的解决方案和系统经验。

三维高斯、大模型等技术在过去一年快速发展,并与数字人技术进行了广泛结合。上海交通大学人工智能研究院助理教授晏轶超将带来主题为《先验引导的三维数字人视频生成》的报告,从数字人重建、生成与编辑等方向介绍三维数字人视频生成的最新进展,并探讨三维数字人技术的发展趋势。

在生成式AI技术的推动下,智能数字人已成为内容创作的重要方向。新壹科技AI算法主任架构师李璋将围绕《视频垂直大模型在智能数字人生成中的应用》,介绍从通用大模型到垂直大模型的技术演进,讲解新壹视频大模型在数字人视频生成中的核心技术突破,并深入分析如何实现自然语言驱动的动作与表情生成,还将展示其在相关领域的典型应用案例。

近期,井英科技通过视频生成模型实现了100分钟以上短视频的制作,并成功实现了用户付费观看的商业模式。公司联合创始人、CTO王健将在此次论坛上将分享AI短剧从最初的不可行到现如今可行的关键技术突破,主题为《AI短剧拐点背后的技术突破》。

随着短视频、影视和游戏动画的快速发展,传统的视频制作方式因耗时耗力而逐渐显现局限性。视频生成大模型算法为高效生成高质量视频提供了新选择,但现有算法的生成内容可控性不足。旷视研究院高级研究员李华东将以《可控人物视频生成》为主题,介绍支持混合模态控制的人像视频生成算法MegActor 系列工作。

主题报告环节结束后的圆桌Panel,将由中存算董事长陈巍,上海交通大学人工智能研究院助理教授晏轶超,井英科技联合创始人、CTO王健,以及旷视研究院高级研究员李华东一起带来。

视频生成群雄逐鹿,哪些重要问题待解?
视频生成群雄逐鹿,哪些重要问题待解?

二、五位学者专家多维度讲解AI视频生成

1、中存算董事长 陈巍

视频生成群雄逐鹿,哪些重要问题待解?

陈巍博士,大模型+AI芯片专家,高级职称,中存算等企业董事长。国际计算机学会(ACM)、中国计算机学会(CCF)专业会员,多个国际人工智能期刊审稿人。主要研究方向为大模型架构、稀疏量化压缩与部署加速,存算一体与3D Chiplet处理器,相关技术成果已被广泛应用于知名IDC和互联网企业。

曾任领域知名人工智能(自然语言处理)企业首席科学家,中国科学院副主任(2012),多个国家科技重大专项课题负责人。中国与美国发明专利软件著作权约70+项(约50+项发明专利已授权)。著有《Sora大模型技术精要—原理、关键技术、模型架构与未来趋势》《GPT-4大模型硬核解读》《ChatGPT大模型技术精要—发展历程、原理、技术架构详解和产业未来》《智能网联汽车:激光与视觉SLAM详解》等。

报告主题:《视频大模型架构对比及长序列模型加速》

内容概要:随着大模型技术的快速发展,视频大模型(VLM)正与短视频产业结合并迎来新的爆发机遇,逐渐成为互联网应用的热点。

本次分享从视频大模型与世界模型的角度,对比主流视频生成大模型架构,探讨视频生成的关键技术(包括NaViT、RADM等),分析视频生成类大模型的主要挑战与发展趋势;探讨内存墙(Memory Wall)和通信墙对视频大模型GPGPU/TPU集群训练和部署的挑战,并针对这类视频长序列模型的算力芯片级训练部署,结合具体项目给出软硬结合的解决方案与系统经验。

2、上海交通大学人工智能研究院助理教授 晏轶超

视频生成群雄逐鹿,哪些重要问题待解?

晏轶超,上海交通大学人工智能研究院助理教授,博士生导师。获上海交通大学电子工程系学士、博士学位,法国里昂中央理工学院硕士学位,曾担任阿联酋起源人工智能研究院研究科学家。主要研究方向为AIGC及三维数字人技术,发表包括TPAMI、CVPR、NeurIPS在内的论文40余篇。先后主持国家自然科学基金青年项目、CCF-阿里巴巴青年科学家基金等项目8项。曾入选上海市海外高层次人才计划,获2020年度中国图象图形学学会优秀博士论文奖。

报告主题:《先验引导的三维数字人视频生成》

内容概要:“人”一直是视频生成的核心对象,面对大规模视频的生成需求,利用生成式人工智能技术产生高拟真,规模化的虚拟数字人正逐渐成为研究热点。三维高斯、大模型等技术在过去一年快速发展,并与数字人技术进行了广泛结合,本次报告将从数字人重建、生成、编辑等方向介绍数字人视频生成领域的最近进展,对三维数字人技术的发展趋势进行探讨。

3、新壹科技AI算法主任架构师 李璋

视频生成群雄逐鹿,哪些重要问题待解?

李璋,拥有中国科学院软件工程硕士学位,是生成式人工智能领域的资深技术专家。在深度学习、算法优化以及大模型研发方面具有深厚的理论基础和丰富的实战经验。在新壹(北京)科技有限公司担任AI算法主任架构师,主导设计并研发了多个具有行业标志性的AI项目。设计与研发了“新壹视频大模型”——国内首个专注于视频生成的生成式AI大模型。该模型在视频内容生成、理解与优化方面取得了突破性成果,为推动国内生成式AI技术在视频领域的实际应用提供了强有力的支撑。

报告主题:《视频垂直大模型在智能数字人生成中的应用》

内容概要:在生成式AI技术蓬勃发展的背景下,智能数字人已成为内容创作、虚拟助手和人机交互等领域的重要应用之一。然而,传统生成模型在高精度、多模态的智能数字人生成中仍面临诸多挑战。为此,垂直领域的大模型提供了一条全新路径。

本次演讲,首先会介绍从通用大模型到垂直大模型的演进,之后将着重讲解新壹视频大模型的整体架构设计及其在数字人视频生成与优化中的核心技术突破;此外,还将对智能数字人生成的技术难点,包括数字人生成中实现自然语言驱动动作与表情生成的关键技术等进行深入分析,并分享视频垂直大模型驱动的智能数字人在相关领域的典型应用案例。

4、井英科技联合创始人、CTO 王健

视频生成群雄逐鹿,哪些重要问题待解?

王健,井英科技联合创始人,CTO,国内视频生成模型的首批创业者,从2020年起专注于视频生成模型及相关应用。在参与创立井英科技之前,担任触宝科技联合创始人、CTO,是触宝输入法主创,自然语言模型专家。

报告主题:《AI短剧拐点背后的技术突破》

内容概要:自今年2月OpenAI发布Sora起,视频生成大模型成为了热点方向。但其具体落地的业务场景却一直不明确。近期,井英科技通过视频生成模型实现了100分钟以上短视频的制作,并成功实现了用户付费观看的商业模式。本次分享将介绍AI短剧从最初的不可行到现如今可行的关键技术突破,并探讨了除视频生成大模型之外的其他关键技术进展。

5、旷视研究院高级研究员 李华东

视频生成群雄逐鹿,哪些重要问题待解?

李华东,旷视研究院高级研究员,硕士毕业于清华大学计算机系。研究方向为计算机视觉,主要包括视频生成与理解,深度估计等,已在ECCV,AAAI等人工智能顶级会议上发表多篇论文。

报告主题:《可控人物视频生成》

内容概要:短视频、影视和游戏动画创作正在迅速发展。然而,传统的视频制作过程耗时耗力,通常需要大量的人工后期编辑。视频生成大模型算法提供了一种低成本、高效的高质量视频内容生成解决方案。但视频生成算法生成的内容可控性不足,限制了其实际应用的有效性。因此,如何实现视频生成内容的可控性仍是一大关键挑战。

在本次报告中,我将介绍 MegActor 系列工作,这是一种支持混合模态控制的人像视频生成算法。该算法支持角色自定义(包括真实人物、二次元人物和游戏人物等),并能够通过视频、音频和文本输入实现单独和混合控制。其功能涵盖了控制角色说话、唱歌和生成表情动画等。MegActor 系列是社区内的首个开源可控人物视频生成大模型,将持续优化以推动技术的不断发展。

三、中国生成式AI大会上海站日程

视频生成群雄逐鹿,哪些重要问题待解?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-26 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像
2023-01-30 16:34:00
别等Sora了!这些国产AI视频大模型,款款都超能打
...OpenAI正式面向大众发布了AI视频大模型SoraTurbo,最高支持生成20秒视频,仅为初次公布Sora时宣传时长的三分之一
2024-12-11 20:13:00
一日连发两款视频大模型,火山引擎要让每个人都能用上AI
...山引擎在深圳举办AI创新巡展,并首次对外发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款AI大模型
2024-09-25 15:00:00
文生视频让自动驾驶看到新方向
...频让自动驾驶看到新方向来源:视觉中国陈颖聪近年来,生成式人工智能在AI技术应用中成为焦点,尤其是文本生成视频大模型Sora,近来更是在全球范围内激发了科技创新的热潮。香港科技
2024-03-14 05:26:00
全网刷频的Sora,有多“可怕”
...,重新定义了 AI 文生视频在现阶段的技术极限,颠覆了生成式 AI 在视频领域的全球市场格局。Sora 使用 Transformer 架构
2024-02-19 09:22:00
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...团队自研打造。自从快手可灵 AI 火爆海内外,国内视频生成也如同 2023 年的文本大模型一样,越来越卷了。刚刚,又一视频生成大模型产品宣布正式上线:智谱 AI 正式发布「清
2024-07-27 09:27:00
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...消息,10月14日,Adobe在Adobe MAX大会上宣布推出Firefly视频生成模型,并强化了现有的图像、矢量和设计模型
2024-10-17 09:52:00
首个3d人像视频生成模型来了
...。眨个眼、动动嘴,都是小case~最近AIGC爆火,3D人像模型生成这边也没闲着。 如StyleNerf、StyleSDF
2023-02-22 19:23:00
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律!自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Y
2024-11-09 09:59:00
更多关于科技的资讯:
罗庄:AI赋能铝合金制造,打造工业智改标杆场景
鲁网3月27日讯近日,山东省临沂市罗庄区临沂利信铝业有限公司铝合金智能配料与全流程协同制造场景落地见效,以人工智能深度赋能铝基新材料生产
2026-03-27 11:06:00
山海有约,樱你而美——青岛市崂山区文创大赛延期至4月12日,北宅樱桃赛道全新开启!
鲁网3月27日讯自“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛启动以来,来自全国各地的文创设计爱好者、高校师生
2026-03-27 11:06:00
厦门举办四场创新场景供需对接
厦门大学附属第一医院展示的全息混合现实医学导航定位系统。(记者 陈立新 摄)厦门网讯(厦门日报记者 王元晖)超过100家带着新技术
2026-03-27 08:20:00
春日为序,西湖区与“文创”相约。昨日,2026年西湖区文创大会在杭州茶叶博览会会议会展中心举行。大会现场发布了西湖区文化“新三样”扶持政策与“三个十”年度案例
2026-03-27 08:29:00
持续推进场景创新 今年屈臣氏计划改造1500家门店
为庆祝屈臣氏集团创立185周年,一家「屈臣氏大药房」以复古主题快闪店的形式落地广州沙面,迅速成为年轻人的打卡胜地,见证着新潮的互动体验与年轻的消费面孔
2026-03-27 08:37:00
交通银行信用卡 春日礼遇已就位
鲁网3月25日讯春日礼遇已就位,交行信用卡宠粉不停,消费满额刮惊喜刷卡金。最红周五享5折优惠,环球漫游笔笔有返现,焕新满减+购票立减,多重好礼陪你过春天。(鲁网记者)责任编辑:范
2026-03-27 09:16:00
优衣库与洛杉矶道奇队达成重要合作,“优衣库·道奇体育场”正式亮相
2026年3月26日,美国洛杉矶—— 全球服饰零售品牌优衣库宣布与洛杉矶道奇队达成一项重要合作,双方将携手为道奇队球迷
2026-03-27 09:55:00
合肥国显8.6代AMOLED产线完成厂房清扫,即将量产
3月26日,合肥国显科技有限公司(以下简称“合肥国显”)第8.6代AMOLED生产线项目在主厂房举行洁净室清扫仪式,标志着全球首条搭载无FMM技术(ViP)的高世代AMOLED生产线已顺利完成厂房建设交付
2026-03-27 08:37:00
入驻英国第一渠道 海尔冰箱上市首日斩获用户青睐
当地时间3月18日,海尔全球旗舰Horizon系列冰箱于英国格林尼治皇家天文台完成全球首发,同步在英国第一家电零售渠道Currys开售
2026-03-27 09:53:00
记录江河脉动 智领未来浪潮 ——星图亿水以新技术推动水利信息化
丙午仲春,京华潮涌。3月,步入位于北京市海淀区中关村壹号的中科星图商业航天创新中心展厅,一场聚焦“空天赋能、智水未来”的深度思考正在进行
2026-03-27 08:37:00
中关村论坛上演“机器人总动员”
3月26日,在中关村国际创新中心,机器人餐吧的机器人在递送饮品。在2026中关村论坛年会上多品牌多形态多用途的智能机器人组团献技呈现一场科技感十足的创新盛宴3月26日
2026-03-27 07:55:00
罗技中国就“罗技G官方旗舰店发布违规内容”致歉
华商网讯 3月26日,@罗技中国 发布致歉声明:来源:华商网 相关热词搜索:
2026-03-27 07:27:00
手指轻触屏幕,一块块榫卯构件在眼前“浮”起;跟随着AI系统的提示,将斗、升、昂、枋依次安放、咬合、锁定;片刻之后,一座微缩斗拱稳稳立在掌心——与此同时
2026-03-27 07:28:00
你的数据参谋已上线,“不服不行,数据比我的直觉准多了。”最近两个月,余杭“味来家”生鲜店创始人钟学刚,被自己的一次“失误”给“上了一课”
2026-03-27 06:58:00
花小小新疆炒米粉再夺「年度米粉十大品牌」
3月25日,在2026中国餐饮产业节暨第35届HCC全球餐饮产业博览会期间,第八届中国餐饮品类红鲤奖评选结果正式揭晓。花小小新疆炒米粉凭借稳定的市场表现与成熟的运营模式
2026-03-26 20:10:00