• 我的订阅
  • 科技

Stable Diffusion 3开源秒翻车,画人好掉san

类别:科技 发布时间:2024-06-14 09:08:00 来源:量子位

没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩,结果长这样?

Stable Diffusion 3开源秒翻车,画人好掉san

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

(前方高能)

Stable Diffusion 3开源秒翻车,画人好掉san

但如果是局部,比如只生成人脸,确实很nice。

Stable Diffusion 3开源秒翻车,画人好掉san

清晰度、写字、写实性等方面都有明显提升。

Stable Diffusion 3开源秒翻车,画人好掉san

对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。

Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

那么问题来了,为啥偏偏画不好人类?

问题可能在于数据集

先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium(中杯)。

它的规模为20亿参数,在笔记本上就能跑了。

官方强调的属性有5方面,逐一来看:

整体质量和写实性

可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。

通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低,非常适合在消费级GPU上运行,且性能不降低。

微调

能够利用小数据集微调,方便定制化。

目前在Hugging Face上已经可以下载模型权重。非商业用途可免费下载使用,商业用途需要先拿授权。

Stable Diffusion 3开源秒翻车,画人好掉san

那么为啥升级后还是会翻车?

有人发现,如果细看“躺在草坪上的女孩”这张图像,会发现它在局部细节上确实还可以,甚至很棒。

Stable Diffusion 3开源秒翻车,画人好掉san

草地上的影子、衣物上反射的光线、头发的质地……都遵循了物理规律。

Stable Diffusion 3开源秒翻车,画人好掉san

但人物整体就不敢恭维了。

不少网友都认为,这就是问题的关键。

我认为他们的NSFW过滤器,把所有人类图像都判定为了NSFW。

Stable Diffusion 3开源秒翻车,画人好掉san

这个过滤器全称是filtering out adult content,作用在于过滤掉不合规的成人内容。

SD2发布时就出现过类似的问题,研究人员发现审查这部分内容可能影响了模型对人体结构的理解。

后面的SD2.1和SDXL版本有所缓解。

这次SD3的翻车,暴露了一个问题:过于严格的数据审核,可能误删了一些无害的成人图像,所以现在模型没法理解人体结构。

有网友就阴阳说,没多久之前SD还能和Midjourney竞争,现在一比,就像个笑话。

至少我们的数据集是安全和合乎道德的。

Stable Diffusion 3开源秒翻车,画人好掉san

Reddit上“SD3-2B发布是个笑话吗”的帖子,热度已经冲到了800+。

Stable Diffusion 3开源秒翻车,画人好掉san

当然,除了技术以外的原因,还不少人觉得SD3的性能不佳更进一步暴露了Stability AI的内部混乱。

我猜他们现在可以安全合规地破产了。

Stable Diffusion 3开源秒翻车,画人好掉san

欠债1亿、疑似求卖身

Stability AI的动荡,从SD3开源的一再延期就能窥见端倪。

2月发布模型后,一开始,官方说的是搞完RLHF就开源,结果大家伙等了3个多月,官方放出的还是只有API。直到现在,才开源了一个中杯版本。

Stable Diffusion 3开源秒翻车,画人好掉san

与此同时,公司CEO Emad辞职+退出董事会。核心团队也被曝集体离职。

今年5月,据The Information消息,这家初创公司已经面临严重现金短缺:第一季度收入不到500万美元,而亏损超过了3000万美元。同时欠了云厂商和其他企业近1亿美元,“求卖身”的消息不断传出。

值得一提的是,消息称SD3还将开源更多版本,包括4B和8B。

不知道更大版本效果会如何呢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 12:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应be like:我分不清,真的分不清啊
2024-10-09 09:55:00
从电商直播到智播,数字虚拟人的打工之路!
...重复。另外一个就是直播时候要回答用评论区里面用户的问题,通过大模型去识别用户的意图之后去匹配相对于的话术,让数字人来回答用问题。比如,沟通互动力方面,特看数字人可以按评论切换
2024-07-31 16:06:00
2024山东本科综合评价招生怎么报,山东师范大学报考指南来了
...请在系统内选择“非‘白名单’奖项省级三等奖及以上或写实性材料(限报三项)”及“县级以上优秀学生或优秀学生干部(限报三项)”奖项类别上传证明材料。7.考生可点击右上角“已填报奖
2024-05-05 14:09:00
《天国:拯救2》硬核模式劝退?移除战斗提示太难了
...、害怕陌生人等,这些独特设置在战斗之外增加了有趣的写实性。文章总结认为,虽然硬核模式在非战斗方面增加了引人入胜的挑战,但对于像作者这样认为基础战斗已经非常困难的玩家来说,其提
2025-04-22 16:40:00
...使用,但已经对AI有了依赖感。 自然,这也导致一些新问题,引起不少人的焦虑。陈惟将其归纳为两方面:AI作为整合工具,无疑将带来大量的版权争议;AI强大的能力,让不少创作者感
2023-06-16 05:57:00
大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类
...一个任务,在论文中还测试了大模型在线性回归和旅行商问题这些经典优化任务上的能力。模型不同,最佳提示词也不同优化问题无处不在,基于导数和梯度的算法是强大的工具,但现实应用中也经
2023-09-11 10:56:00
以“吕乐”为原型七部电影,郭富城版本最差,刘德华版本最经典!
...“吕乐”。影片爆粗口、暴力镜头较多,还原度比较高,写实性更强,是一部不折不扣的“爽片”。任达华把“吕乐”的“笑里藏刀”、“圆滑世故”、“凶狠无比”诠释得非常到位,表现可圈可点
2023-07-28 12:43:00
“钢之魂”落寞后,日本玩家开始喜欢中国的机甲游戏
...的钢铁板块状作为常见的基础设计风格,强调机兵的工业写实性。同时,围绕这种写实的工业化设计感,一些机体的铆钉细节与马达构造都做得非常显眼。机甲的机械结构非常细节在游戏的战斗环节
2024-12-02 07:48:00
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大
2024-11-26 09:44:00
更多关于科技的资讯:
冲刺四季度 打好收官战丨湖北佳恒:以“智”提“质” 产值已超去年全年
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新锻造核心竞争力,湖北佳恒科技以智能化改造与自主研发双轮并进,推动企业高质量发展
2025-10-12 19:27:00
西电连续三次入选教育部“人工智能+高等教育”应用场景典型案例
近日,教育部公布第三批30个“人工智能+高等教育”应用场景典型案例遴选结果。学校《“西电智评”——数智赋能学生评价的探索与实践》案例成功入选
2025-10-12 13:56:00
见证首次无动力帆船环越南极,飞利浦鹅卵石Pro剃须刀以科技实力硬核护航,净护随行
2025年10月10日,人类首次帆船环航南极之旅于上海白莲泾旅游码头启航。由国家海洋公益形象大使、中国航海科普大使、中国环球航海第一人
2025-10-12 13:35:00
“电力工程号A星”今日出征
2025年10月12日,长光卫星技术股份有限公司在吉林省航天信息产业园举行“电力工程号A星”的出征仪式。公司及合作单位的领导和职工代表参加活动
2025-10-12 11:56:00
刷新多项世界纪录!我国新型单光子探测器量产落地
大皖新闻讯 日前,安徽省量子信息工程技术研究中心发布消息称,我国实现了全球首款四通道超低噪声半导体单光子探测器的量产落地(以下简称“深度制冷单光子探测器”)
2025-10-12 10:52:00
深入实施“人工智能+”行动丨浪潮智能终端“超高清+AI”解锁场景新玩法
漫步浩瀚太空,秒回侏罗纪时代,与科幻机甲同框……济南方特东方神画“九州神韵”的XR拍摄专区,小学生李安安兴奋地“穿越”在异时空中
2025-10-11 10:21:00
近日,据大象新闻报道,疾控卫监部门在一次突击检查中发现,某美容院将普通的高频电灼仪包装为“黄金微针”项目进行推广。这类看似创新的营销话术
2025-10-11 12:36:00
中新经纬10月11日电 (李自曼)近期,多家险企推出1年期的短期重疾险产品。同样保额下,传统重疾险保费动辄千元甚至上万元
2025-10-11 13:55:00
滨州移动织就“数字救援网”,赋能红十字演练通信零死角
鲁网10月11日讯近日,中国红十字应急救援北部协作区综合救援演练在山东省滨州市惠民县黄河三角洲应急消防实训基地拉开帷幕
2025-10-11 14:44:00
看点十足!2025中国移动全球合作伙伴大会变身“AI嘉年华”
当碳基生命的创造力与硅基生命的智慧力深度融合,将迸发出怎样的“AI+”可能?2025年10月10日—10月12日,中国移动全球合作伙伴大会在广州保利世贸博览馆盛大召开
2025-10-11 15:31:00
中国移动董事长杨杰:碳硅共生 合创AI+时代
10月10日至12日,2025中国移动全球合作伙伴大会在广州举行。10月11日上午,中国移动董事长杨杰出席大会主论坛,并发表题为《碳硅共生 合创AI+时代》的主旨演讲
2025-10-11 15:31:00
北京apm多重活动焕活国庆长假新体验,解锁假日新乐趣!
国庆假日期间,北京apm以“沉浸式假日体验”为核心,精心打造多元互动活动、热门IP联名快闪与专属会员福利矩阵,为王府井商圈注入鲜活动能与浓郁假日氛围
2025-10-11 15:41:00
山东乐陵:“老味道”飘出消费新滋味
位于乐陵市经济开发区的山东金鹏德盛斋扒鸡有限公司扒鸡生产车间内,老师傅王强不再像过去那样,紧盯着油炸锅、凭经验调节火力
2025-10-11 16:03:00
近日,张家口农商银行钟楼北小贷中心积极组织开展一场针对光大新天地商城内各商户的专项走访活动。此次活动旨在深入了解商城内各类商户的经营状况
2025-10-11 16:20:00
易生支付:智慧支付护航国庆文旅消费 赋能区域商业活力升级
2025年国庆长假期间,全国文旅消费市场持续呈现旺盛活力。易生支付凭借高并发交易处理、全渠道聚合支付、实时资金清算等核心技术能力
2025-10-11 17:08:00