• 我的订阅
  • 科技

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

类别:科技 发布时间:2024-02-26 22:00:00 来源:果壳网

以下文章来源于硅星人Pro,作者硅星人Pro

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

在文生图领域,Midjourney像是玩具,而Stable Diffusion凭借稳定、可控和高效的能力,一直是最接近可用工具的一款文生图模型。

2024年2月22日,stability.ai发布了 Stable Diffusion 3 早期预览版。这款模型目前还没开放测试。

排队链接:https://stability.ai/stablediffusion3

本次更新重点:在图片质量、多主题提示(multi-subject prompts)和单词拼写能力方面有大幅提升;使用了新型扩散变压器(类似于Sora)并结合了流量匹配和其他改进;模型尺寸从 800m 到 8B 参数,将适用于各种设备的部署;安全贯穿模型训练、测试、评估和部署全过程。

虽然现在还没能开放测试,但一些stability.ai的员工已经开始在社交媒体晒图了。Sora带了一波“好头”。

Prompt:Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat.(一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形,右边是一只狗,左边是一只猫)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

Prompt:Three transparent glass bottles on a wooden table. The one on the left has red liquid and the number 1. The one in the middle has blue liquid and the number 2. The one on the right has green liquid and the number 3.(木桌上放着三个透明玻璃瓶。左边的是红色液体,数字是 1。中间的是蓝色液体,数字是 2。右边的是绿色液体和数字 3)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

Prompt:Anime style illustration of a newsstand on top of a small grassy hill, on top of the newsstand we see the text "it's here!". In the background we see a big rain approaching.(一幅动漫风格的插图,画的是小草山顶上的一个报刊亭,在报刊亭的顶部,我们看到 "它来了!"的文字。背景是一场大雨即将来临。)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

Prompt:A horse balancing on top of a colorful ball in a field with green grass and a mountain in the background.(在一片绿草如茵的田野上,一匹马在一个五颜六色的球上面保持平衡,背景是一座山)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

Prompt:Wide photo of a shipwreck on the beach, lots of rust and moss on the ship contrasting with the beautiful blue of the ocean water and the peace that the beauty of nature conveys. The big waves are magnificent and touch the ship.(海边沉船的宽幅照片,船上的大量锈迹和苔藓与海水的美丽蔚蓝形成鲜明对比,大自然的美给人带来宁静。大浪波澜壮阔,触及船只。)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

以上Stable Diffusion 3的图片来自@andrekerygma和@EMostaque。SDXL和DELL-E的部分是通过他们给出的Prompt自己做的。

目前展现出的Stable Diffusion 3的表现基本上可以100%的还原提示词。马的那幅图,还能看到马踩在球上,球发生了形变。

这次更新的一个重点是单词的拼写能力。比如:

Prompt:Photo of an 90's desktop computer on a work desk, on the computer screen it says "welcome". On the wall in the background we see beautiful graffiti with the text "SD3" very large on the wall.(办公桌上 90 年代台式电脑的照片,电脑屏幕上写着 "欢迎"。在背景墙上,我们看到了美丽的涂鸦,"SD3 "字样非常醒目。)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

Prompt:Resting on the kitchen table is an embroidered cloth with the text 'good night' and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic.(灶台上放着一块刺绣布,上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性。)

Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?

不管是屏幕上的显像管效果,还是绣布上面的刺绣效果,虽然在提示词中没有给出明确的提示词,Stable Diffusion 3也给welcome、good night这些文字使用了最合适的效果展现,文字和画面融合堪称完美。

之后放出技术细节和开放测试之后,我们也会再上手测试一波,欢迎大家持续关注我们。

不过测试什么的都已经是次要的了,从目前展现出的能力来看,Stable Diffusion 3已经完全可以当做日常的作图使用。

本文经授权转载自硅星人Pro(ID:Si-Planet),如需二次转载请联系原作者。欢迎转发到朋友圈。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-26 23:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Sora为何没能诞生在中国?
...提示框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。北
2024-03-19 05:31:00
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。一位时髦女士漫步在东京街头,周围
2024-02-16 18:44:00
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...26日报道,今天一早,大模型独角兽智谱AI正式发布视频生成工具清影,可支持文生、图生6秒时长的视频,即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。先来看看
2024-07-27 09:18:00
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...的称号几次易主。每一次技术迭代,都不断刷新着AI图像生成质量和速度的上限。于是现在,我们输入几个文字就能得到任何想要的画面。无论是专业级别的商业海报,还是超写实画风的写真照片
2024-08-13 09:39:00
Sora冲击波 抢人“饭碗”促生新职业?
...通用人工智能的实现近日,OpenAI正式发布了旗下首款视频生成模型Sora,引爆全球关注。据介绍,Sora可根据提示词,生成长达一分钟的短视频,同时保持视觉质量并遵守用户的提
2024-03-02 09:59:00
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版
2024-08-05 09:39:00
stablediffusion3:文字渲染能力大升级
...说是目前文生图、文生视频的通病了。就拿世超用DALL·E3生成的“Chaping青花瓷”为例,上面汉字不明所以。。
2024-02-25 03:03:00
国产“Sora”亮相中关村,文生视频相关个股有哪些
...代。据介绍,Vidu采用研发团队原创的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界
2024-04-28 15:37:00
“清华系Sora”全球上线!首发实测:多镜头切换强到爆,30秒生成大片
...刚刚,清华系大模型创企生数科技,在全球范围上线视频生成模型Vidu,全面开放文生、图生视频能力。先来看看效果://oss
2024-07-31 09:37:00
更多关于科技的资讯:
节日我在岗丨十堰高周波:抓创新赶订单 全力冲刺年度目标
十堰广电讯(全媒体记者 陈林)在国庆中秋假期,位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单,全力冲刺年度目标
2025-10-05 20:21:00
节日我在岗丨艾斯卓智能科技:节日不休 赶制订单
十堰广电讯(全媒体记者 耿吉国)放假不放松,生产不停工。国庆中秋长假,我市各生产企业铆足干劲抓生产、赶订单,奋力冲刺年度目标任务
2025-10-05 20:21:00
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00