• 我的订阅
  • 科技

Stable Diffusion 3开源秒翻车,画人好掉san

类别:科技 发布时间:2024-06-14 09:08:00 来源:量子位

没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩,结果长这样?

Stable Diffusion 3开源秒翻车,画人好掉san

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

(前方高能)

Stable Diffusion 3开源秒翻车,画人好掉san

但如果是局部,比如只生成人脸,确实很nice。

Stable Diffusion 3开源秒翻车,画人好掉san

清晰度、写字、写实性等方面都有明显提升。

Stable Diffusion 3开源秒翻车,画人好掉san

对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。

Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

那么问题来了,为啥偏偏画不好人类?

问题可能在于数据集

先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium(中杯)。

它的规模为20亿参数,在笔记本上就能跑了。

官方强调的属性有5方面,逐一来看:

整体质量和写实性

可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。

通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低,非常适合在消费级GPU上运行,且性能不降低。

微调

能够利用小数据集微调,方便定制化。

目前在Hugging Face上已经可以下载模型权重。非商业用途可免费下载使用,商业用途需要先拿授权。

Stable Diffusion 3开源秒翻车,画人好掉san

那么为啥升级后还是会翻车?

有人发现,如果细看“躺在草坪上的女孩”这张图像,会发现它在局部细节上确实还可以,甚至很棒。

Stable Diffusion 3开源秒翻车,画人好掉san

草地上的影子、衣物上反射的光线、头发的质地……都遵循了物理规律。

Stable Diffusion 3开源秒翻车,画人好掉san

但人物整体就不敢恭维了。

不少网友都认为,这就是问题的关键。

我认为他们的NSFW过滤器,把所有人类图像都判定为了NSFW。

Stable Diffusion 3开源秒翻车,画人好掉san

这个过滤器全称是filtering out adult content,作用在于过滤掉不合规的成人内容。

SD2发布时就出现过类似的问题,研究人员发现审查这部分内容可能影响了模型对人体结构的理解。

后面的SD2.1和SDXL版本有所缓解。

这次SD3的翻车,暴露了一个问题:过于严格的数据审核,可能误删了一些无害的成人图像,所以现在模型没法理解人体结构。

有网友就阴阳说,没多久之前SD还能和Midjourney竞争,现在一比,就像个笑话。

至少我们的数据集是安全和合乎道德的。

Stable Diffusion 3开源秒翻车,画人好掉san

Reddit上“SD3-2B发布是个笑话吗”的帖子,热度已经冲到了800+。

Stable Diffusion 3开源秒翻车,画人好掉san

当然,除了技术以外的原因,还不少人觉得SD3的性能不佳更进一步暴露了Stability AI的内部混乱。

我猜他们现在可以安全合规地破产了。

Stable Diffusion 3开源秒翻车,画人好掉san

欠债1亿、疑似求卖身

Stability AI的动荡,从SD3开源的一再延期就能窥见端倪。

2月发布模型后,一开始,官方说的是搞完RLHF就开源,结果大家伙等了3个多月,官方放出的还是只有API。直到现在,才开源了一个中杯版本。

Stable Diffusion 3开源秒翻车,画人好掉san

与此同时,公司CEO Emad辞职+退出董事会。核心团队也被曝集体离职。

今年5月,据The Information消息,这家初创公司已经面临严重现金短缺:第一季度收入不到500万美元,而亏损超过了3000万美元。同时欠了云厂商和其他企业近1亿美元,“求卖身”的消息不断传出。

值得一提的是,消息称SD3还将开源更多版本,包括4B和8B。

不知道更大版本效果会如何呢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 12:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应be like:我分不清,真的分不清啊
2024-10-09 09:55:00
从电商直播到智播,数字虚拟人的打工之路!
...重复。另外一个就是直播时候要回答用评论区里面用户的问题,通过大模型去识别用户的意图之后去匹配相对于的话术,让数字人来回答用问题。比如,沟通互动力方面,特看数字人可以按评论切换
2024-07-31 16:06:00
2024山东本科综合评价招生怎么报,山东师范大学报考指南来了
...请在系统内选择“非‘白名单’奖项省级三等奖及以上或写实性材料(限报三项)”及“县级以上优秀学生或优秀学生干部(限报三项)”奖项类别上传证明材料。7.考生可点击右上角“已填报奖
2024-05-05 14:09:00
《天国:拯救2》硬核模式劝退?移除战斗提示太难了
...、害怕陌生人等,这些独特设置在战斗之外增加了有趣的写实性。文章总结认为,虽然硬核模式在非战斗方面增加了引人入胜的挑战,但对于像作者这样认为基础战斗已经非常困难的玩家来说,其提
2025-04-22 16:40:00
...使用,但已经对AI有了依赖感。 自然,这也导致一些新问题,引起不少人的焦虑。陈惟将其归纳为两方面:AI作为整合工具,无疑将带来大量的版权争议;AI强大的能力,让不少创作者感
2023-06-16 05:57:00
大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类
...一个任务,在论文中还测试了大模型在线性回归和旅行商问题这些经典优化任务上的能力。模型不同,最佳提示词也不同优化问题无处不在,基于导数和梯度的算法是强大的工具,但现实应用中也经
2023-09-11 10:56:00
以“吕乐”为原型七部电影,郭富城版本最差,刘德华版本最经典!
...“吕乐”。影片爆粗口、暴力镜头较多,还原度比较高,写实性更强,是一部不折不扣的“爽片”。任达华把“吕乐”的“笑里藏刀”、“圆滑世故”、“凶狠无比”诠释得非常到位,表现可圈可点
2023-07-28 12:43:00
“钢之魂”落寞后,日本玩家开始喜欢中国的机甲游戏
...的钢铁板块状作为常见的基础设计风格,强调机兵的工业写实性。同时,围绕这种写实的工业化设计感,一些机体的铆钉细节与马达构造都做得非常显眼。机甲的机械结构非常细节在游戏的战斗环节
2024-12-02 07:48:00
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大
2024-11-26 09:44:00
更多关于科技的资讯:
中国姚绣站上巴黎大展C位
1月15日至19日,非遗苏绣品牌姚绣(Yao Silk)再度亮相巴黎M&O展,成为本届展会Fine Craft(精品工艺)展区唯一中国品牌
2026-01-17 09:40:00
民大学子全国“摘金” AI巧解垃圾分类与楼宇管理难题
荆楚网(湖北日报网)讯(记者林杉 许文秀 通讯员陈韶月 张祎晗)面对垃圾分类的效率瓶颈,人工智能与机械设计如何给出更优解
2026-01-17 10:36:00
长白时评评论员 久泰平近日多起滥用“七天无理由退货”的新闻引发社会关注。有商家曝光,有学生集体网购演出服,演出后再把带着污渍
2026-01-17 05:55:00
1月14日消息,工业和信息化部近日公布了2025年全国中小企业人工智能典型应用场景名单,晋西春雷自主研发的“AI视觉质检实现铜带缺陷精准识别”项目成功入选
2026-01-17 07:39:00
当患者或患者家属去医院的病案室复印住院病历时,会发现住院病案首页出院诊断表格上有一栏疾病编码,疾病编码栏下填有一串串字母数字组成的编码
2026-01-17 04:40:00
■李伯宸 四川传媒学院摘要:随着时代的发展和科学技术的进步,数字媒体艺术与人工智能技术已经为人类的生活方式带来了深刻的变化
2026-01-17 04:40:00
■刘舒浅 对外经济贸易大学管理学院摘要:大数据技术对传统统计工作产生了重要的影响。将大数据与传统统计方法相融合,是统计工作实现规范化
2026-01-17 04:40:00
车联天下与AMD达成战略合作,共推智能网联汽车技术升级
全球汽车产业正加速向电动化、智能化和网联化转型,智能驾驶和车载娱乐已成为未来出行体验的重要驱动力。AI和高性能计算技术在车辆感知
2026-01-16 21:22:00
百奥赛图(688796)以基因编辑技术起家,是一家创新药临床前CRO及生物技术公司,专门为创新药企业提供抗体药物发现及临床前研发服务
2026-01-16 22:48:00
中新经纬1月16日电 16日下午,市场监管总局召开食品安全专题新闻发布会。市场监管总局食品协调司副司长母兰在发布会上称
2026-01-16 21:34:00
在生成式AI重塑信息检索范式的当下,GEO(生成式引擎优化)已从营销小众赛道跃升为企业数字化转型的核心增长引擎。据艾瑞咨询《2026 GEO行业报告》显示
2026-01-16 21:23:00
中国优秀AI企业2026年展望:AI技术迭代深化引领商业化规模化落地 全球AI产业进入技术深耕与商业化兑现双轮加速期,中国优秀AI企业迎来价值释放关键窗口
2026-01-16 17:14:00
8个省级高质量数据集、324家省级“晨星工厂” 临沂扎实筑牢“人工智能+”发展根基
鲁网1月16日讯 (记者 李文静)数据是赋能人工智能训练的原材料。1月16日上午,临沂市人民政府新闻办公室召开新闻发布会
2026-01-16 17:18:00
中新经纬1月16日电 题:中国电影IP的长期主义,还缺什么?作者 张志鹏 中国广告协会文创与IP专业委员会副主任近日,玩具制造商桑尼森迪正式递表港交所
2026-01-16 17:22:00
贾国龙最新发声:今晚10点 将就罗永浩对西贝的重大污蔑诽谤全面回应
华商网讯 1月16日,西贝贾国龙发文称,将就罗永浩对西贝的重大污蔑诽谤一一全面回应。据了解,此前,1月16日,罗永浩再次发长文回应西贝贾国龙近日言论
2026-01-16 18:46:00