• 我的订阅
  • 科技

Stable Diffusion 3开源秒翻车,画人好掉san

类别:科技 发布时间:2024-06-14 09:08:00 来源:量子位

没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩,结果长这样?

Stable Diffusion 3开源秒翻车,画人好掉san

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

(前方高能)

Stable Diffusion 3开源秒翻车,画人好掉san

但如果是局部,比如只生成人脸,确实很nice。

Stable Diffusion 3开源秒翻车,画人好掉san

清晰度、写字、写实性等方面都有明显提升。

Stable Diffusion 3开源秒翻车,画人好掉san

对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。

Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

那么问题来了,为啥偏偏画不好人类?

问题可能在于数据集

先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium(中杯)。

它的规模为20亿参数,在笔记本上就能跑了。

官方强调的属性有5方面,逐一来看:

整体质量和写实性

可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。

通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低,非常适合在消费级GPU上运行,且性能不降低。

微调

能够利用小数据集微调,方便定制化。

目前在Hugging Face上已经可以下载模型权重。非商业用途可免费下载使用,商业用途需要先拿授权。

Stable Diffusion 3开源秒翻车,画人好掉san

那么为啥升级后还是会翻车?

有人发现,如果细看“躺在草坪上的女孩”这张图像,会发现它在局部细节上确实还可以,甚至很棒。

Stable Diffusion 3开源秒翻车,画人好掉san

草地上的影子、衣物上反射的光线、头发的质地……都遵循了物理规律。

Stable Diffusion 3开源秒翻车,画人好掉san

但人物整体就不敢恭维了。

不少网友都认为,这就是问题的关键。

我认为他们的NSFW过滤器,把所有人类图像都判定为了NSFW。

Stable Diffusion 3开源秒翻车,画人好掉san

这个过滤器全称是filtering out adult content,作用在于过滤掉不合规的成人内容。

SD2发布时就出现过类似的问题,研究人员发现审查这部分内容可能影响了模型对人体结构的理解。

后面的SD2.1和SDXL版本有所缓解。

这次SD3的翻车,暴露了一个问题:过于严格的数据审核,可能误删了一些无害的成人图像,所以现在模型没法理解人体结构。

有网友就阴阳说,没多久之前SD还能和Midjourney竞争,现在一比,就像个笑话。

至少我们的数据集是安全和合乎道德的。

Stable Diffusion 3开源秒翻车,画人好掉san

Reddit上“SD3-2B发布是个笑话吗”的帖子,热度已经冲到了800+。

Stable Diffusion 3开源秒翻车,画人好掉san

当然,除了技术以外的原因,还不少人觉得SD3的性能不佳更进一步暴露了Stability AI的内部混乱。

我猜他们现在可以安全合规地破产了。

Stable Diffusion 3开源秒翻车,画人好掉san

欠债1亿、疑似求卖身

Stability AI的动荡,从SD3开源的一再延期就能窥见端倪。

2月发布模型后,一开始,官方说的是搞完RLHF就开源,结果大家伙等了3个多月,官方放出的还是只有API。直到现在,才开源了一个中杯版本。

Stable Diffusion 3开源秒翻车,画人好掉san

与此同时,公司CEO Emad辞职+退出董事会。核心团队也被曝集体离职。

今年5月,据The Information消息,这家初创公司已经面临严重现金短缺:第一季度收入不到500万美元,而亏损超过了3000万美元。同时欠了云厂商和其他企业近1亿美元,“求卖身”的消息不断传出。

值得一提的是,消息称SD3还将开源更多版本,包括4B和8B。

不知道更大版本效果会如何呢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 12:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应be like:我分不清,真的分不清啊
2024-10-09 09:55:00
从电商直播到智播,数字虚拟人的打工之路!
...重复。另外一个就是直播时候要回答用评论区里面用户的问题,通过大模型去识别用户的意图之后去匹配相对于的话术,让数字人来回答用问题。比如,沟通互动力方面,特看数字人可以按评论切换
2024-07-31 16:06:00
2024山东本科综合评价招生怎么报,山东师范大学报考指南来了
...请在系统内选择“非‘白名单’奖项省级三等奖及以上或写实性材料(限报三项)”及“县级以上优秀学生或优秀学生干部(限报三项)”奖项类别上传证明材料。7.考生可点击右上角“已填报奖
2024-05-05 14:09:00
《天国:拯救2》硬核模式劝退?移除战斗提示太难了
...、害怕陌生人等,这些独特设置在战斗之外增加了有趣的写实性。文章总结认为,虽然硬核模式在非战斗方面增加了引人入胜的挑战,但对于像作者这样认为基础战斗已经非常困难的玩家来说,其提
2025-04-22 16:40:00
...使用,但已经对AI有了依赖感。 自然,这也导致一些新问题,引起不少人的焦虑。陈惟将其归纳为两方面:AI作为整合工具,无疑将带来大量的版权争议;AI强大的能力,让不少创作者感
2023-06-16 05:57:00
大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类
...一个任务,在论文中还测试了大模型在线性回归和旅行商问题这些经典优化任务上的能力。模型不同,最佳提示词也不同优化问题无处不在,基于导数和梯度的算法是强大的工具,但现实应用中也经
2023-09-11 10:56:00
以“吕乐”为原型七部电影,郭富城版本最差,刘德华版本最经典!
...“吕乐”。影片爆粗口、暴力镜头较多,还原度比较高,写实性更强,是一部不折不扣的“爽片”。任达华把“吕乐”的“笑里藏刀”、“圆滑世故”、“凶狠无比”诠释得非常到位,表现可圈可点
2023-07-28 12:43:00
“钢之魂”落寞后,日本玩家开始喜欢中国的机甲游戏
...的钢铁板块状作为常见的基础设计风格,强调机兵的工业写实性。同时,围绕这种写实的工业化设计感,一些机体的铆钉细节与马达构造都做得非常显眼。机甲的机械结构非常细节在游戏的战斗环节
2024-12-02 07:48:00
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大
2024-11-26 09:44:00
更多关于科技的资讯:
出海的隐性分水岭:中小企业开始直面“品牌能力”的考验
过去几年,中国中小企业的出海进程明显提速。从新能源、智能制造到各类工业技术与解决方案型企业,越来越多公司完成了将产品推向海外市场的第一步
2026-02-24 17:15:00
服务人次958万,云迹科技机器人服务智能体全力保障春节
2026年春节期间,人工智能与具身智能技术深度融入大众节日生活,展现出从“可选项”向“必需品”转变的显著趋势。在酒店、景区
2026-02-24 17:18:00
海辰储能山东一体化零碳产业园将于二季度试生产— 一场瞄准AI时代的能源“卡位战”
鲁网2月24日讯除夕夜,黄宣田在菏泽学会了包饺子。作为厦门海辰储能科技股份有限公司(以下简称“海辰储能”)菏泽制造基地负责人
2026-02-24 17:28:00
25000㎡、300+品牌、20000+买家:亚洲户外烧烤展5月定档广州,打造全球户外生活商贸枢纽
随着露营经济等消费趋势兴起,消费者对高品质、体验式户外生活的需求日益增长,全球掀起一股烧烤热潮。从家庭聚会到户外派对,烧烤不再只是厨房的延伸
2026-02-24 17:51:00
庙会上的科技范儿
科技庙会上机器人在给市民免费送年货。机器人“店小二”在售卖饮品。机器人在和小朋友“智对诗章”。机器人舞狮表演吸引众多游客围观
2026-02-24 14:56:00
新春之际,年货市场掀起新潮流。AI眼镜、陪伴机器人、无弦吉他成为抢手货,3D打印机现做生肖模型、智能书法台挥毫送福成新景
2026-02-24 14:56:00
大麦娱乐灯塔研究院春节档洞察:总票房57.52亿,三四线城市票房近53%
2月24日,大麦娱乐旗下灯塔研究院发布《2026年春节档电影市场洞察报告》。报告显示,2026年春节档总票房达57.52亿
2026-02-24 14:58:00
理解“长途优先”背后的平衡智慧
这两天,“长途有票、短途无票”的话题在网络上引发了不少讨论。不少旅客感到困惑:明明同一趟车,为什么长途票能买到短途票却显示“无票”
2026-02-24 15:11:00
中国消费者报讯(记者万晓东)近日,谦寻控股在《直播电商监督管理办法》(以下简称《办法》)出台后积极组织全员开展专题学习
2026-02-24 15:26:00
稻米品质评价及智慧栽培优化
水稻是全球最重要的粮食作物之一,世界近半数人口以稻米为主食。中国是世界第一大稻米生产国与消费国,三分之二人口以稻米为主粮
2026-02-24 15:40:00
大润发贺新年:以实惠为笔,绘就万家团圆暖色调
岁末年初,新春的烟火气裹挟着期待在街巷蔓延。作为民生消费的核心阵地,大润发紧扣“年味”脉搏,以覆盖生鲜、年货、零食、礼品的惠民折扣
2026-02-24 11:27:00
万马奔腾越山海|听,这是潍柴雷沃海外人的“新春奋进曲”
鲁网2月24日讯新春团圆时,奋斗不停歇。当祖国大地张灯结彩欢度春节,潍柴雷沃海外人依然在异国他乡默默坚守,用奋斗奏响一曲昂扬的“新春奋进曲”
2026-02-24 11:28:00
新年伊始,深谋发布震撼拜年视频,以其大载重eVTOL飞行器为“筋斗云”,搭载具身智能人形机器人“美猴王”腾云驾雾的空中拜年视频
2026-02-24 11:32:00
新年复工迎客流高峰:老字号珠宝定制热潮迭起 三大升级马年启新章
“哈哈,不到九点,你们店还没开门,我们就到了”,子冈珠宝定制坊苏州总店新年第一位顾客说。为此店长为这位总店马年首位顾客送上普陀山书院文创伴手礼
2026-02-24 13:01:00
春晚宇树四分半:全球人形机器人一哥的功夫梦
这已经是宇树机器人第三次亮相春晚,我们却感到了前所未有的震撼。今年的央视春节联欢晚会上,还是那家全球领先的宇树科技,把舞台当成了新技术的展示场
2026-02-24 12:04:00