• 我的订阅
  • 科技

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

类别:科技 发布时间:2024-08-14 09:39:00 来源:机器之心Pro

用 Clapper 做视频,你只需要当导演就行了。

Sora 一出,视频领域似乎已经进入了生成式 AI 时代。不过直到今天,我们仍然没有用上 OpenAI 的官方视频生成工具,等不及的人们已经开始寻找其他的方法。

最近几周,一款开源的视频编辑工具 Clapper 引发了人们的关注。

与很多科技公司提供的视频生成器不同,Clapper 是一款开源 AI 故事可视化工具,于一年前推出原型。它的设计目的并非取代传统视频编辑器,或使用 3D 场景作为输入的现代 AI 编辑器。

Clapper 的理念是集合各类生成式 AI 技术,让任何人都能通过交互式、迭代和直观的过程使用 AI 创建视频。无需外部工具、电影制作或 AI 工程技能。在 Clapper 中,你无需直接编辑视频和音频文件序列,而是通过调整高级、抽象的概念,如角色、位置、天气、时间段、风格等,基于 AI Agent 来迭代你的故事。

Clapper 的作者 Julian Bilcke 是 HuggingFace 的一名 AI 前端工程师。他表示,为了向这个方向继续努力,他还在开发导演模式:目标是让使用者可以全屏播放视频,舒适地坐在导演椅(或沙发)上,向 Agent 大喊命令,让 AI 制作电影。

最近几天,Julian Bilcke 已经上线了使用大模型将任意文本转换为时间线等新功能。而 Clapper 的热度也水涨船高,在 GitHub 上已经拥有超过 1100 的 Star 量。

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

GitHub 链接:https://github.com/jbilcke-hf/clapper HuggingFace 链接:https://huggingface.co/spaces/jbilcke-hf/clapper/tree/main 试用网址:https://clapper.app/

如何使用

既然是开源工具,我们主要看的当然是具体好不好用。

还记得 AI 大牛 Karpathy 创作 AI 短视频的体验吗?为了将《傲慢与偏见》开头的三句话变成动画版,足足花了这位顶尖高手一个小时。虽然只有三句话,三个场景,但这个工作流远比三句话要复杂。他先用 Claude 根据原文生成了一系列图像提示词,再将这些提示词输入文生图模型生成对应的图像,再交给视频模型制作动画,配音的任务分配给了 Elevenlabs,最后在 Veed Studio 里把所有片段整合起来。

于是,Karpathy 做完后发推吐槽,称:「创业者们,机会来了!市面上急需一个能够整合、简化这些流程的 AI 工具。」

Clapper 正是一个集成了所有这些功能的一站式平台。

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

通常想做一条短视频,需要经历以下几个步骤。首先需要一个故事和脚本,然后根据脚本画出分镜,再根据分镜拍摄或寻找素材,将它们在剪辑软件拼合起来,添加动画效果和特效,再有选择性地配上口播、背景音乐或音效。因此,影视制作行业中编导、导演、摄像、剪辑、后期、配音等分工应运而生。

而在 Clapper,视频制作遵循另一条逻辑。它的每条轨道不像 Premier、剪映等剪辑软件一样对应着视频或图片素材,而是对应着一个具体的工种。

剪映的素材轨道

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

Clapper 的轨道

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

在用 AI 做视频这件事上,我们就是 AI 的甲方。Clapper 就像一个由业内最强的 AI 组成的剧组。Clapper 内置像 GPT-4o,Claude 3.5(Sonnet)等一系列「顶流」大模型。它就像乙方的执行导演一样,负责将你的需求对接给对应的「AI 编导」。

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

从上面的图中可以看出,第一条轨道代表着故事版,和 Clapper 内置的大模型对话,它将通过 API 调取文生图模型,让 AI 分镜老师来生成对应的图片,作为视频画面的基础。

通过 Clapper 可以访问以上文生图模型

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

以 Clapper 给出的样片为例,接下来的轨道依次对应场景、旁白、摄像机的视角、背景音乐以及音效。你可以要求 ElevenLabs 或 Fal.ai 为这个西部废土世界的故事生成一些废墟的风声或者枪战的爆炸声。

而 Clapper 还有一项功能,可能真的向「会说话就能拍电影」的愿望迈进了一大步。我们可以直接向 Clapper 导入剧本,并且在「故事」一栏细致地为你的主人公创造人设。

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

以《绿野仙踪》为例,我们不仅可以为人物添加更加个性化的人物描述,还可以上传图片,为女主人公多萝西设置视觉形象。这意味着我们可以请世界上的任何演员来扮演这个角色,哪怕你想看 18 岁的小李子演多萝西,都可以实现。Clapper 的功能细致到你可以调整人物的年龄和音色,每个场景的陈设,多萝西的房间有什么家具,他们冒险的目的地「翡翠城」的房子长什么样子,都可以在 Clapper 中随心调整。

开源AI视频工具,你只需要当导演,HuggingFace工程师打造

当然,你也可以先用 AI 画一些气氛图出来,说不定能更进一步地激发你的灵感和创意。

不过,虽然 Clapper 的功能已经充分地考虑了做视频的需求,但是它的效果却有些差强人意。不仅画面中人物的动作有些「鬼畜」,不符合物理运动规律。视频的整体效果更像是会动的 PPT,缺乏镜头之间的转场和连续感,并且配乐也 AI 味十足,听起来没有旋律,还有些杂音。

可能生成式 AI 想要改变视频制作的流程,还需要很长时间,但 Clapper 的出现或许能给还在给传统视频剪辑软件拓展 AI 功能的大厂们,提供了一条新的落地思路。

参考内容:

https://news.ycombinator.com/item?id=41221399

https://x.com/aigclink/status/1818111874531205216

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-14 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI“文生视频”如何改变未来?业内:AI很难做到复杂的情感
...近20.4万个类似的职位受到AI的冲击。根据这项调查,音效工程师、配音演员和概念艺术家将首当其冲,视觉效果和其他后期制作也将受到冲击。如果技术继续进步,这类职位将越来越多地被
2024-02-18 19:07:00
6个月估值达2亿美元,文生视频Pika超强更新,斯坦福华人博士出品|最前线
...人Karlin Chen 拥有 CMU 的 ML&CV 硕士学位,曾在商汤担任工程师,4号员工Matan Cohen-Grumi 的经验主要在创意领域
2023-11-30 20:54:00
比赛开始了!Sora对手直呼奥特曼是魔术师,创意行业最先受冲击?
...,OpenAI将利用Sora“大规模进军好莱坞”:“尽管类似的AI视频工具已经存在,OpenAI的系统体现了该技术的快速增长
2024-02-18 18:30:00
...行业求职人数同比增速(33.4%)位居行业第一,人工智能工程师以69.6%的求职增速位居职业榜首。在招聘端,人工智能工程师以21319元的平均招聘月薪领跑。人工智能工程师细分
2025-02-12 07:58:00
专家:openai语音转写工具存在重大缺陷
...28日消息,当地时间27日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI的语音转写工具Whisper存在一个重大缺陷:有时会凭空生成大段甚至整句虚
2024-10-29 05:46:00
物流工程项目远程交付与相关技术
...,有时候甚至需要“爬梯子”。第三,不同的时差情况对工程师作息时间产生较大影响,互相之间时间不同步,发生问题时,由于涉及多个层面的技术要相互配合、互相等待,调试效率很低。四、远
2022-12-21 06:00:00
大模型迎来爆发节点,谁来帮中国AI产业打好地基?
...。而在数据、算力之外,AI从业者,特别是最核心的算法工程师,还需要大量的开发工具。“算法工程师很多时候并没有真正研究算法,而是把时间浪费在了环境搭建的工作上。”在WAIC大会
2023-07-10 19:02:00
新AI编程工具爆火:手机2分钟创建一个APP
...不懂技术”不能成为借口的时代。如果你会说话,你就是工程师。以下是他们用AI工具直播打造初创公司的全过程:视频地址:https://mp
2024-09-09 13:34:00
微软开始在 Windows 上推出现代化的照片应用
...如下图所示。在一份发给WindowsLatest的声明中,一位微软工程师也确认了新版照片应用的推出,并将视频编辑器替换为Clipchamp
2023-09-12 08:49:00
更多关于科技的资讯:
新消费|今年“双11”,福州年轻人主打一个“人间清醒”
开栏语:消费,并不只是“买买买”,它展示个人选择,反映市场动向,也揭示社会风尚。即日起,掌上福州客户端开设《新消费》专栏
2025-11-11 21:29:00
奢游国际再获殊荣:斐济旅游局颁授“最佳奢华产品合作旅行社”
近日,奢游国际荣膺斐济旅游局颁发的“最佳奢华产品合作旅行社”奖项,这是继马尔代夫旅游局、大溪地旅游局后,我们斩获第三个来自官方海岛旅游局的权威肯定
2025-11-11 13:49:00
大赛赋能破茧成蝶!朗威黄坤分享企业跨越式发展成长故事
鲁网11月11日讯(记者 李晓晨)11月10日,驻济高校大学生乡村振兴创新创业大赛暨“农商银行杯”商河县第十届青年创新创业大赛新闻发布会举行
2025-11-11 13:54:00
厦门网讯 (厦门日报记者 许晓婷 王玉婷 通讯员 林玮)昨日,记者从市邮政管理局获悉,10月20日至11月9日,我市揽收快件4369万件
2025-11-11 08:38:00
中国科大在2025年国际基因工程机器大赛(iGEM)中荣获金牌
大皖新闻讯 近日,国际基因工程机器大赛(iGEM)在法国巴黎落下帷幕。本届大赛吸引了来自全球多个国家和地区的400余支队伍参赛
2025-11-11 11:38:00
烟台联通成功举办“智联万物 制造未来”高质量发展主题会议
胶东在线11月11日讯为深入推进制造业数字化转型,赋能区域经济高质量发展,在烟台市工业和信息化局大力支持下,近日,由烟台联通主办的“智联万物 制造未来”高质量发展主题会议顺利召开
2025-11-11 13:29:00
厦门网讯 (厦门日报记者 林露虹)“平时我们更多是在实验室做科研,这次比赛让我们和产业界有了深入交流,对我们的成长很有帮助
2025-11-11 08:38:00
千里姻缘一线牵:米连用户从线上相识到终成眷属
去年五月,25岁的万森在伊对平台上偶然认识了26岁的陈珊,惊讶地发现两人竟然是同乡,他们的村子相距仅60公里。更令人称奇的是
2025-11-11 08:47:00
企创云课堂直播课预告丨GaN功率器件与功率集成电路:赋能下一代高效能源系统
氮化镓(GaN)功率器件正成为推动能源电子系统高效化、小型化、智能化的核心技术,引领电力电子从“硅时代”迈向“宽禁带时代”
2025-11-11 08:47:00
京津冀机器人产业链配套需求与供给能力清单发布需求聚集产业 “邻居”成为“伙伴”河北日报讯(记者米彦泽)作为2025京津冀产业链供应链对接活动的系列活动之一
2025-11-11 09:13:00
2025 Wallpaper*中文版设计大奖 于深圳湾文化广场完美落幕
(2025 年 11 月 3 日,深圳)第五届Wallpaper*中文版设计大奖在湾区全新文化地标——深圳湾文化广场圆满落幕
2025-11-11 09:17:00
“链”动先“机”,济南锚定这个“万亿级”|链上济南项新行
编者按:“十五五”规划建议中提出,提升产业链自主可控水平,强化产业基础再造和重大技术装备攻关,滚动实施制造业重点产业链高质量发展行动
2025-11-11 09:39:00
河北新闻网讯(曾儒奇)房产主播轮番上阵,数十场“直播看房”实时开讲;线上专门设立金融服务窗口,为购房者提供信贷全流程指导
2025-11-11 10:01:00
日常活跃度不高、功能相对单一,维护和优化更新成本却高昂——金融机构“断舍离” App掀起“关停潮”□南京日报/紫金山新闻记者曹丽珍买理财
2025-11-11 08:02:00
艾拓生命“全自动液态悬浮芯片检测仪”获批
艾拓生命“全自动液态悬浮芯片检测仪”获批宁企“芯”突破,检测精度高艾拓生命“全自动液态悬浮芯片检测仪”。 企业供图南报网讯(通讯员江高轩记者张希)近日
2025-11-11 08:03:00