• 我的订阅
  • 科技

Stable Diffusion 3开源秒翻车,画人好掉san

类别:科技 发布时间:2024-06-14 09:08:00 来源:量子位

没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩,结果长这样?

Stable Diffusion 3开源秒翻车,画人好掉san

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

(前方高能)

Stable Diffusion 3开源秒翻车,画人好掉san

但如果是局部,比如只生成人脸,确实很nice。

Stable Diffusion 3开源秒翻车,画人好掉san

清晰度、写字、写实性等方面都有明显提升。

Stable Diffusion 3开源秒翻车,画人好掉san

对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。

Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

那么问题来了,为啥偏偏画不好人类?

问题可能在于数据集

先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium(中杯)。

它的规模为20亿参数,在笔记本上就能跑了。

官方强调的属性有5方面,逐一来看:

整体质量和写实性

可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。

通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低,非常适合在消费级GPU上运行,且性能不降低。

微调

能够利用小数据集微调,方便定制化。

目前在Hugging Face上已经可以下载模型权重。非商业用途可免费下载使用,商业用途需要先拿授权。

Stable Diffusion 3开源秒翻车,画人好掉san

那么为啥升级后还是会翻车?

有人发现,如果细看“躺在草坪上的女孩”这张图像,会发现它在局部细节上确实还可以,甚至很棒。

Stable Diffusion 3开源秒翻车,画人好掉san

草地上的影子、衣物上反射的光线、头发的质地……都遵循了物理规律。

Stable Diffusion 3开源秒翻车,画人好掉san

但人物整体就不敢恭维了。

不少网友都认为,这就是问题的关键。

我认为他们的NSFW过滤器,把所有人类图像都判定为了NSFW。

Stable Diffusion 3开源秒翻车,画人好掉san

这个过滤器全称是filtering out adult content,作用在于过滤掉不合规的成人内容。

SD2发布时就出现过类似的问题,研究人员发现审查这部分内容可能影响了模型对人体结构的理解。

后面的SD2.1和SDXL版本有所缓解。

这次SD3的翻车,暴露了一个问题:过于严格的数据审核,可能误删了一些无害的成人图像,所以现在模型没法理解人体结构。

有网友就阴阳说,没多久之前SD还能和Midjourney竞争,现在一比,就像个笑话。

至少我们的数据集是安全和合乎道德的。

Stable Diffusion 3开源秒翻车,画人好掉san

Reddit上“SD3-2B发布是个笑话吗”的帖子,热度已经冲到了800+。

Stable Diffusion 3开源秒翻车,画人好掉san

当然,除了技术以外的原因,还不少人觉得SD3的性能不佳更进一步暴露了Stability AI的内部混乱。

我猜他们现在可以安全合规地破产了。

Stable Diffusion 3开源秒翻车,画人好掉san

欠债1亿、疑似求卖身

Stability AI的动荡,从SD3开源的一再延期就能窥见端倪。

2月发布模型后,一开始,官方说的是搞完RLHF就开源,结果大家伙等了3个多月,官方放出的还是只有API。直到现在,才开源了一个中杯版本。

Stable Diffusion 3开源秒翻车,画人好掉san

与此同时,公司CEO Emad辞职+退出董事会。核心团队也被曝集体离职。

今年5月,据The Information消息,这家初创公司已经面临严重现金短缺:第一季度收入不到500万美元,而亏损超过了3000万美元。同时欠了云厂商和其他企业近1亿美元,“求卖身”的消息不断传出。

值得一提的是,消息称SD3还将开源更多版本,包括4B和8B。

不知道更大版本效果会如何呢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 12:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应be like:我分不清,真的分不清啊
2024-10-09 09:55:00
从电商直播到智播,数字虚拟人的打工之路!
...重复。另外一个就是直播时候要回答用评论区里面用户的问题,通过大模型去识别用户的意图之后去匹配相对于的话术,让数字人来回答用问题。比如,沟通互动力方面,特看数字人可以按评论切换
2024-07-31 16:06:00
2024山东本科综合评价招生怎么报,山东师范大学报考指南来了
...请在系统内选择“非‘白名单’奖项省级三等奖及以上或写实性材料(限报三项)”及“县级以上优秀学生或优秀学生干部(限报三项)”奖项类别上传证明材料。7.考生可点击右上角“已填报奖
2024-05-05 14:09:00
《天国:拯救2》硬核模式劝退?移除战斗提示太难了
...、害怕陌生人等,这些独特设置在战斗之外增加了有趣的写实性。文章总结认为,虽然硬核模式在非战斗方面增加了引人入胜的挑战,但对于像作者这样认为基础战斗已经非常困难的玩家来说,其提
2025-04-22 16:40:00
...使用,但已经对AI有了依赖感。 自然,这也导致一些新问题,引起不少人的焦虑。陈惟将其归纳为两方面:AI作为整合工具,无疑将带来大量的版权争议;AI强大的能力,让不少创作者感
2023-06-16 05:57:00
大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类
...一个任务,在论文中还测试了大模型在线性回归和旅行商问题这些经典优化任务上的能力。模型不同,最佳提示词也不同优化问题无处不在,基于导数和梯度的算法是强大的工具,但现实应用中也经
2023-09-11 10:56:00
以“吕乐”为原型七部电影,郭富城版本最差,刘德华版本最经典!
...“吕乐”。影片爆粗口、暴力镜头较多,还原度比较高,写实性更强,是一部不折不扣的“爽片”。任达华把“吕乐”的“笑里藏刀”、“圆滑世故”、“凶狠无比”诠释得非常到位,表现可圈可点
2023-07-28 12:43:00
“钢之魂”落寞后,日本玩家开始喜欢中国的机甲游戏
...的钢铁板块状作为常见的基础设计风格,强调机兵的工业写实性。同时,围绕这种写实的工业化设计感,一些机体的铆钉细节与马达构造都做得非常显眼。机甲的机械结构非常细节在游戏的战斗环节
2024-12-02 07:48:00
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大
2024-11-26 09:44:00
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00