• 我的订阅
  • 科技

meta推出两款基于ai的图像编辑工具

类别:科技 发布时间:2023-11-20 11:38:00 来源:浅语科技

11月20日消息,Meta昨日宣布为Facebook和Instagram推出两款基于AI的图像编辑工具,分别是“EmuEdit”和“EmuVideo”,适用领域包括照片和视频,目前Meta公布了这两项AI工具的更多信息,IT之家整理如下。

官方介绍称,EmuEdit模型仅用文字指令就可以准确编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。

meta推出两款基于ai的图像编辑工具

据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务,为视频编辑提供更多功能与更高的精确度。

EmuEdit可以接受用户指令,进行各种形式的编辑,包括区域和全局编辑、移除和添加背景,也能够调整颜色并进行矢量图转换,或进行图像构成元素的检测和分割。

Meta表示,EmuEdit把视觉任务作为指令,纳入到所生成模型中,进而在视频生成和编辑中,提供更好的控制能力。研究人员指出,当前的图像编辑模型,通常会过度修改图像,或是修改不足,而EmuEdit的优势在于能够准确按照指令进行编辑。

Meta使用了1000万个合成数据集训练EmuEdit,号称是目前同类中规模最大的数据集,从而带来了更好的图像编辑能力,其中每个样本都包含图像输入、任务描述,以及目标输出图像。可使模型忠实地执行指令,产生“比当前所有竞品都要好的结果”。

而EmuVideo是一种简单且高效的文字转视频生成方法,该方法运用扩散模型,并以EmuEdit为基础。开发团队解释,这种通过生成视频的架构能够应对外界各种输入方式,包括文字、图像、图文组合等,此外EmuVideo也能接受文字类提示词,将用户提供的图像“动画化”,从而提供了“超越过去模型的能力”。

EmuVideo将影片生成过程拆分为两个步骤,首先是根据文字提示生成图像,然后基于文字和生成图像产生视频。这种拆分步骤的影片生成方法,让研究人员可以有效地训练生成模型。

研究人员进一步解释,EmuVideo与过去Make-A-Video等需要一系列深度生成模型的研究不同,EmuVideo更简单,仅使用2个扩散模型,就能生成512x512分辨率、每秒16FPS、长4秒钟的视频。

IT之家发现,Meta援引评估数据,证明EmuVideo生成的视频品质以及“遵循提示词的忠实程度”相对业内竞品更好。

在品质方面,有96%受访者偏好EmuVideo而非此前的Make-A-Video方案,而对于“提示词的忠实度”方面,EmuVideo获得了85%受访者的青睐。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-20 15:45:15

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
...12 月 17 日消息,谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像
2024-12-18 09:29:00
什么是ai绘图工具?
...品的程度。 多功能整合:越来越多的AI绘图工具集成了图像编辑、风格转换、图像修复等功能,为用户提供一站式的解决方案。同时也在不断集成到不同种类的平台中,降低了用户的使用门槛
2024-06-21 08:36:00
AIGC生成图像加速度 百亿赛道将开启
...其他互联网巨头、AI独角兽等各行业玩家也在集体涌进AIGC图像生成赛道,如百度的文心一格、腾讯的AI画匠、蓝色光标的“创意画廊”等
2023-04-23 16:45:00
meta推出全新ai图像生成器,可创建高分辨率图像
...到,Meta于上个与宣布为Facebook和Instagram推出两款基于AI的图像编辑工具,分别是“EmuEdit”和“EmuVideo”
2023-12-07 13:34:00
谷歌发布新型ai图像生成工具
12月17日,谷歌发布了一款名为Whisk的新型AI图像生成工具。Whisk的最大亮点在于,用户无需编写冗长的文本提示,只需上传其他图像,即可生成新图像。这一创新方式大大简化了图
2024-12-19 01:46:00
一文详解AIGC:忘记概念,只聊落地
...用又好玩的事情,背后是AI能力的征程。2. AIGC能力支撑 图像识别和分类:AIGC可以通过图像识别技术,对图片进行分类,例如识别包含人物、自然景观、动物等不同类型的图片。
2023-06-10 15:00:00
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...汽车、蛋糕等,都可以快速修改!有多位网友评论说,AI图像编辑真的进步飞快,“能读懂用户心思”是非常具有未来感的用户体验。甚至还有网友说,颤抖吧,PS! MagicQuill
2024-11-21 09:43:00
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...型,即使在无网络环境下也能执行多种任务,如生成PPT和图像编辑。同时,高通还发布了手机专属芯片骁龙8 Gen3,让手机课可以运行10亿参数规模的AI大模型
2023-10-30 15:31:00
目前可用的最佳 AI 图像生成器
...斯到受韦斯·安德森启发的电影预告片,人工智能生成的图像在互联网上变得越来越普遍。原因不难看出——现代人工智能工具已经变得如此令人信服,以至于它们的图像甚至赢得了著名的摄影奖。
2023-05-08 09:15:00
更多关于科技的资讯: