• 我的订阅
  • 科技

“旗舰版”文生图开源模型来袭,Stability AI发布SDXL 1.0 | 最前线

类别:科技 发布时间:2023-07-28 11:14:00 来源:36氪

作者 | 黄金琼

编辑 | 邓咏仪

北京时间7月27日,Stability AI宣布推出最新的图像生成模型Stable Diffusion XL 1.0,Stable Diffusion XL 1.0的开源版本,当前可在GitHub上进行访问。

Stable Diffusion已经是目前全球使用最广泛的开源文生图模型。本次推出的Stable Diffusion XL 1.0,其实只和上一个版本0.9的推出时间相差不久,新版本相当于是一个“旗舰版本”。

“旗舰版”文生图开源模型来袭,Stability AI发布SDXL 1.0 | 最前线

来源:Stability AI

Stability AI也称其是目前为止“最先进”的版本,事实也如此。Stable Diffusion XL 1.0在图片的色彩更鲜艳和准确,并且对比度、阴影以及光影效果方面更佳。

并且,Stability AI这次还发布了Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。其中发布的API包含了测试版的微调功能,允许用户使用最少5张图像来“专门”生成特定的人、产品等。

参数是模型的核心参数,在这一方面,Stable Diffusion XL 1.0有进一步的提升。据TechCrunch报道,Stability AI的应用机器学习负责人Joe Penna表示,Stable Diffusion XL 1.0包含35 亿个参数,能在“几秒钟内”生成多种长宽比的100 万像素分辨率的完整图像。

相对于此,上一代模型Stable Diffusion XL 0.9尽管能生成更高分辨率的图像,并且在修复、补全图像上能力更强,但同时要求更高的计算能力。

Stable Diffusion XL 1.0在操作上也更方便快捷,提供更具个性化的操作。Penna表示:“Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。它也更容易使用,可以通过基本的自然语言处理提示,来实现复杂的设计。”

目前,Stability AI已将稳定的Stable Diffusion XL 1.0部署亚马逊关于生成式AI模型的云平台项目(Amazon Bedrock)中,也宣布与AWS进行深度合作。

不过,Stability AI当前还是面临各类道德争议。比如在训练模型的数据来源方面,Stability AI采用了包括艺术家的作品等数据用于训练,这引发了艺术家本人的抗议。

尽管Stability AI认为,这符合美国的合理使用原则并坚持使用,但在艺术家们选择诉讼来警告这种行为后,Stability AI还是选择尊重艺术家们的要求——从数据集中删除作品。而后,Stability AI转而与新兴企业Spawning合作,以寻求训练数据。

并且,Stable Diffusion XL 1.0也和之前的版本尚未能避免被滥用的问题——不少人利用开源版本来进行换脸、生成有害的内容。

除此之外,Stability AI近期也深陷负面新闻漩涡,包括创始人Emad的造假传闻等等。而据TechCrunch,Stability AI由于在快速烧钱,在资金方面也颇有压力,正在大力拓展销售,并且寻找融资。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-28 15:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

字节跳动发布文生图sdxl-lightning
...23日消息,据报道,从知情人士处获悉,字节跳动发布了文生图开放模型SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模
2024-02-24 10:57:00
联发科天玑9300实现70亿ai大语言模型!
...和性能。从已知信息来看,联发科与vivo合作可以覆盖“文生文”、“文生图”等大部分生成式AI应用场景,已经满足了当前最全的手机用户生成式AI使用需求,这也是行业第一次在移动端
2023-10-19 19:52:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...一款电动汽车Apple CarPika联手北大斯坦福发表论文,开源文生图框架大模型第一线微软组建新团队来造更轻且便宜的AI模型1月23日
2024-01-29 09:34:00
OpenAI于去年4月推出了第二代DALL-E“文生图”模型,凭借其强大的实力,吸引了业界的广泛关注。近日,OpenAI正在准备下一代DALL-EAI模型(DALL-E3)
2023-08-03 21:14:00
“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶 | 最前线
...图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。图片、文字、视频互相生成,接入360“全家桶” 时隔两个月,如今的“
2023-06-14 14:31:00
商汤科技sensetime推出“云端边”全栈大模型体系
...了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。率先完成“云端边”全栈布局:端侧
2024-04-25 01:02:00
360智脑大模型重新定义AI数字人
...图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。会上,360智脑“文生视频”多模态功能国内首发,任何文字脚本都可生成
2023-06-14 12:18:00
天玑 9300 安兔兔跑分曝光:200 万分逆天
...端运行。根据已知的信息,联发科与vivo合作可以覆盖“文生文”、“文生图”等大部分生成式AI应用场景,已经满足了当前最全的手机用户生成式AI使用需求,这也是行业第一次在移动端
2023-10-23 22:49:00
...影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。在技术交流日,记者发现,这五大模型以全新版本全面亮
2024-04-29 04:36:00
更多关于科技的资讯: