• 我的订阅
  • 科技

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

类别:科技 发布时间:2024-08-26 09:56:00 来源:量子位

AI圈,再次开卷图像生成。

一连串进展扎堆:

8月21日,Ideogram正式推出2.0版本,声称文本渲染能力更强。

没错,就是那个成立于去年8月,由谷歌AI绘画4大牛集体离职创业的项目,曾获得过一众AI大佬投资。

此番Ideogram还公开叫板Flux,官方自信表示其人类评估明显优于Flux Pro。

要知道,Flux由Stable Diffusion原班人马打造,最近正在因生成以假乱真的TED演讲“照片”而走红各大网络。

除此之外,一周前,谷歌正式放出了Imagen 3,在官方评估中,号称表现优于DALL-E 3、Midjourney v6、Stable Diffusion 3等一众绘图模型。

或许是受刺激了(doge),Midjourney竟然也转性了,在8月22日直接向所有用户推出了免费网页版。

这下有好戏看了!

既然大家都宣称自己很强,那我们不妨把大家拉到一桌,来搞个面对面PK。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

谁是最强绘图AI?

先请出咱们的4位参赛选手(全部使用网页版):

1号选手:Ideogram 2.0。每天免费有10积分,1积分可以生成4张图,每天最多生成40张图; 2号选手:Flux.1。黑森林官方在Hugging Chat提供了免费demo(选FLUX.1 Schnell版本); 3号选手:Imagen 3。在Image FX上可以免费无限次使用; 4号选手:Midjourney。免费试用期一共只有生成25张图的机会;

下面正式进入比赛环节。

黑猴子全翻车了

一上来,为了检验这些国外AI是否理解中文提示词,咱们也来蹭一波当今顶流黑猴子的热度。

prompt:游戏角色,一只猴子,身披盔甲,头戴凤羽金冠,手上拿着一根金箍棒,站在一座悬崖之上。

不出意外,意外发生了……

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

相信大家一眼都被3号的大红叉给吸引了。没错,同一提示词下,只有3号Imagen 3拒绝了生成请求。

看到这儿,第一反应是我们的提示词是不是触发了版权保护。于是先删掉了提示词中的“游戏角色”,结果还是提醒无法生成。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

难道是谷歌Imagen 3不支持中文?于是又随机换了一个更简单的提示词,这下倒是有图了。

只不过结果一整个大错误,而且换了多个中文提示词,最终都是一些毫不相关的纹路图。

看来谷歌Imagen 3确实对中文提示词不ok。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

3号落榜之后,再看其他几位,也只有1号Ideogram 2.0表现最佳。

2号倒还能看出国漫的影子,4号Midjourney则完全放飞自我了~(主打一个毫不相干)

最后还是要表扬下Ideogram 2.0,精准命中了所有关键元素。

虽然不是本人心中想要的东西(想要黑神话),但提示词还原度确实没毛病。

是真人还是AI?傻傻分不清楚

接下来进入各位选手的舒适区——人像生成。

遥想当年,Midjourney以一张天台情侣合照火爆网络;眼下,Flux更是以一组TED演讲图风靡全网……

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

究竟谁更胜一筹?答案马上揭晓。

prompt:A young man with auburn hair, wearing a checkered shirt in teal and cream, captured with a 50mm lens for a vintage look. Rich colors, sharp focus, and a touch of retro charm.一位红褐色头发的年轻男性,身着蓝绿色奶油色方格衬衫,用50mm镜头捕捉复古风格。色彩丰富,焦点清晰,带有一丝复古魅力。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

先单看2号和4号,很明显,Midjourney赢了!

从细节上看,2号Flux.1稍有偏差,衣服颜色多了两种,这在一水的蓝绿格子衬衫中尤为突出。

另外,一上来我们还发现了Imagen 3独有的一个小亮点:在生成开始前圈出关键词。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

借着它完成的工作,我们正好可以检验几位选手对关键元素(蓝绿色方格衬衫、50mm镜头等)的还原程度。

可以看到,整体上几位选手表现都不错(除了2号),还原度较高且都看向了镜头。

而且,要不是这些都是本人亲自用AI生成的,还真无法一下子辨认与真人的区别。(汗颜)

最后悄咪咪说一句,4号选手Midjourney颜值最高。

老大难:图片显示文字

成功骗过了所有人之后,是时候让AI吃点苦头了——

给图片加文字。

这事儿一直都是个老大难,也成了检验AI生图水平的标准之一。

话不多说,直接让几位选手制作一块精美的广告牌。请各位看官老爷自行带入甲方爸爸角色。

prompt:A horizontal brass sign reading ‘Festive Season’ in a stylish script, encircled by pine and holly on a dark wood backdrop, with a close-up focus on the golden lettering.一块水平黄铜标牌,上面以时尚手写体写着’Festive Season’,周围环绕着松枝和冬青,背景是深色木材,特写镜头聚焦于金色字体。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

一眼扫过,是不是都还不错,好像都高度还原了提示词?

但是,一旦拿出甲方爸爸的犀利眼神,这2号可就藏不住了。

注意看,2号Flux.1偷工减料了,单词“Season”少了一个字母“S”。

不过除了2号,其他几位还是不错滴,看来各家AI在文字渲染功能上都下功夫了。

所以接下来就是,萝卜青菜各有所爱,大家凭个人喜好做选择。(私心投给了Midjourney)

对了,1号Ideogram这次型号升级还特意拿“文字渲染”功能做宣传了,大家不妨多试试。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

参考麦当劳,整点AI广告

最近,麦当劳请了11个AI美女为薯条疯狂打call,狠狠火了一把~

其实原理也比较简单,无非是用AI生成不同角色宣传薯条的图片,再拼接成一个视频。

没想到效果惊人,仅在推特一个平台,相关视频就获得了近千万浏览量。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

掌握财富密码后,咱们正式开干,身为中国人,AI助农高低得走起~

prompt:Against the backdrop of a cyberpunk-style metropolis, a girl is promoting organic agricultural products in her hands.在赛博朋克风格的都市背景下,一位女孩正宣传着手中的有机农产品。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

很好,3号选手再次“摆烂了”。不过这波着实令人费解,提示词既不是中文,也没有明显违禁的地方……

淘汰3号后,1号选手Ideogram 2.0带货种类最为丰富,大白菜、西红柿、紫甘蓝等应有尽有。

而且它是唯一一个打出文字招牌来宣传有机食品的,看得出来相当卖力了~

另外,细看还能发现只有1号在尽力模仿真人,而2号和4号则完全走上了二刺猿。

u1s1,如果参考麦麦的广告风格,这一次的短暂生成确实没有达到理想效果。(希望更贴近真实一点)

但是,好在这几个AI工具目前都可以免费用,多来几次也不是不行,重点还是方法论。[doge]

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

别急着走,其实还有一个更靠谱的搞钱方法——

用AI轻松拿捏棚拍商业宣传海报,省下请摄影师、场地和后期的钱不香嘛。

A sleek lipstick tube gleams against a backdrop of sophistication, highlighting the rich pigment and smooth glide. Evoke luxury with sharp focus and a hint of shimmer.一支光滑的口红管在精致的背景前闪耀,突显出浓郁的色泽和顺滑的涂抹感。以锐利的焦点和一抹微光唤起奢华感。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

考考大家,假如你要给身边某位女性挑一只口红,你会选哪只?(死亡考验来了)

嘿嘿,所以有人选4号了吗?

虽然4号Midjourney看起来灰常高级,但这个黑色可能有点小众了。(慎选)

除了它,接下来表现最好的是3号Imagen 3,底下丝绒布料衬托出奢华感,且最重要的是,口红质地很真实。

对比之下,1号和2号都显得有点假,“塑料感”扑面而来。

因此这一局,整体来说3号选手获胜。

小结一下,整体而言4位选手表现都非常不错。中文提示词下,黑马选手Ideogram 2.0表现最好。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

谁是Ideogram?

今年2月,Ideogram推出了1.0版本,短短半年时间,它再次进化上线了2.0版本。

事实上,Ideogram与谷歌可谓“沾亲带故”。

成立于去年8月,创始团队中前4人都是谷歌文生图研究Imagen论文作者。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

CEO Mohammad Norouzi,论文共同一作,他在多伦多大学计算机科学博士就读期间拿到了谷歌ML博士奖学金。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

毕业后他加入谷歌大脑工作了7年,职位也一路升至高级研究科学家,主要研究的就是生成模型。

此外,他也是谷歌神经机器翻译团队的原始成员,Hinton团队自监督对比学习框架SimCLR的合著者。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

CTO William Chan(陳俊樂),论文共同一作,他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。

他2012年加入谷歌时先做的机器学习广告工程,后转到谷歌大脑作NLP研究。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

联合创始人 Jonathan Ho,博士毕业于UC伯克利,曾在OpenAI工作一年,后加入谷歌。

他除了是Imagen论文的核心贡献者,还是去噪扩散模型奠基之作《Denoising Diffusion Probabilistic Models》的一作,这篇论文合著者中的Pieter Abbeel也是Ideogram AI的投资人。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

联合创始人 Chitwan Saharia,论文共同一作,本科毕业于孟买理工学院,2019年加入谷歌,在谷歌主要负责领导image-to-image扩散模型的工作。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

创始团队中的另外三人,Shayaan Abdullah曾是Twitter的机器学习工程师,于去年4月离职,后加入Ideogram AI。

Jacob Lu为软件工程师,加入Ideogram之前曾在亚马逊等公司任职;Jenny Lei是软件工程实习生,加入Ideogram AI之前曾在谷歌实习。

可以看出,Ideogram由顶级扩散模型研究团队组成,自成立之初便获得了资本青睐。

Ideogram种子轮融资由a16z和Index Ventures领投,金额1650万美元(当时约1.2亿人民币)。

个人投资者中也不乏Andrej Karpathy、强化学习大牛Pieter Abbeel,GitHub联合创始人Tom Preston-Werner等。

Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测

另外,今年2月,多方消息传出Ideogram进行了新一轮融资。

据称成功筹集了8000万美元(约57亿人民币)A轮融资,领投方为Andreessen Horowitz,其他参与投资者包括Index Ventures、Redpoint Ventures、Pear VC和SV Angel。

看来有钱、有技术的Ideogram无疑又是AI生图领域的一匹黑马。

卷,继续卷。

Ideogram 2.0链接:https://ideogram.ai/t/explore

Midjourney链接:https://www.midjourney.com/home

Flux链接:https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

Imagen3链接:https://aitestkitchen.withgoogle.com/tools/image-fx

参考链接:[1]https://x.com/ideogram_ai/status/1826277550798278804[2]https://ideogram.ai/launch[3]https://x.com/AIandDesign/status/1826277963681370213

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-26 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相
...尖模型能力,做出更强大、更简单的AI产品。” 搜狐科技实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首
2025-03-31 20:04:00
一手体验电脑版豆包后,我删除了购物车里的AI PC
...醒功能都十分便捷,带来了创新的跨应用体验。二、上手实测四大能力,一键写文案、读文献、画素材在当下快节奏的工作和学习环境中,我们常常面临着诸多痛点需求。信息的爆炸式增长让有效的
2024-07-26 09:31:00
“黑马”东风纳米为何横空出世?
...成绩”的补能效率,在挑战赛中也是技压群雄。实际上,实测数据显示纳米BOX的直流快充半小时电量即从30%提升至80%,慢充也仅需要3-4个小时可充满,充电效率明显领先于同级对手
2023-07-07 09:24:00
扫地机器人拖地哪家强?5款实测对比:网红款翻车,黑马突围
这是不是你们家平时拖地的样子?辛辛苦苦拖了半个小时,弄到腰酸背痛,以为已经拖得很干净了,结果……前几天我看了一下今年清洁设备的销售情况,发现洗地机已经打败了吸尘器,成为清洁类家电
2023-01-10 02:00:00
quadrok2200显卡和gtx750ti哪个更好?
...的区别》也做过介绍,不过当时没有进行具体的显卡对比实测,这里我们就分别找来两张quadro专业显卡和geforce游戏显卡,通过实测的方式告诉大家到底该如何选择。专业显卡是什
2022-12-29 11:31:00
独立通话+双微信!览邦腕上手机黑马,插卡秒变主力机​
...态+视频通话独立插SIM卡通话:支持三大运营商4G全网通,实测地铁/电梯场景通话清晰度提升40%双微信先进科技:微信手表版:同步手机消息,快速语音回复独立微信:可登录第二账号
2025-02-20 16:59:00
记者暗访“AI脱衣”:涉幼童软色情图片轻松买卖
...AI生成的未成年软色情图片、视频提供传播渠道。在搜索实测中,记者轻松就能搜索出很多衣着暴露、姿势带有性暗示的AI生成女性图片。如果关键词再详细一点,也不乏未成年女孩的软色情生
2023-08-28 16:13:00
DeepSeek宣布R1小版本试升级:网友实测编程能力已达到国际一线水平
...人意外的是,R2没有等来,却迎来了R1的小版本升级,但实测后实力依然惊人。昨日晚间,DeepSeek在官方交流群中发布通知
2025-05-29 08:58:00
AI赋能文本秒级图示化 万兴科技旗下亿图图示PPT插件全新发布
近日,AIGC软件A股上市公司万兴科技(300624.SZ)旗下绘图创意软件明星产品亿图图示持续提升AI能力,面向国内用户重磅推出PPT图示创作神器“亿图图示PPT插件”
2025-02-21 15:33:00
更多关于科技的资讯:
全产业链展示秀出硬实力 “集优品·向辛行”2025辛集国际皮革盛会开幕
河北新闻网8月2日讯(侯淼、毛宇)今天,2025外贸优品中华行(辛集专场)暨辛集国际皮革皮草时装周、中国(辛集)国际皮毛时装博览会在辛集国际皮革城正式开幕
2025-08-02 21:44:00
7月31日下午,一场科技与美学的奇幻碰撞正在上演,孩子们的手指轻划屏幕,一件又一件充满设计感的服装瞬间“穿”在虚拟模特身上
2025-08-02 08:14:00
250万元撬动2000万元!六盘水:“小”券激活“大”经济
7月31日晚七点,金鸿购物超市人潮涌动。王女士的购物车里放着刚挑选好的榴莲和小龙虾,手机里一张“满100减30”的消费券即将核销
2025-08-02 13:57:00
德州扒鸡:在传承与创新中焕发新生
鲁网8月2日讯(记者 吴美琳 实习记者 费书慧)8月1日,德州市举行第二场“产业链上的山东好品牌”系列记者见面会,邀请山东德州扒鸡股份有限公司副董事长
2025-08-02 14:13:00
从清晨到日暮 恩博力以“冠军标准”定义健康家居新体验
(广告)在碧波与奖牌的背后,一位花样游泳世界冠军的日常,由无数个对细节的精准把控和对健康的不懈追求构筑而成。作为恩博力品牌代言人
2025-08-02 14:25:00
深国际·太原智慧物流制造项目主体完工
8月2日,深国际·太原智慧物流制造项目主体建设已经完工,目前,正在进行内部平台的改造,部分设备已进场。
2025-08-02 18:21:00
振健科技布局全国八大直营生产基地,引领行业高质量发展
近日,广东振健生物科技股份有限公司(以下简称:振健科技)宣布,企业已在全国范围内成功建立八大直营生产基地,主要分布在广州
2025-08-02 19:24:00
《聊斋志异·崂山道士》系列数字资产首发上线乐数通
由人民美术出版社正版授权,云栖博悟(杭州)文化传播有限公司设计发行的首款文化数字资产——《聊斋志异·崂山道士》,于2025年7月31日在浙江文化产权交易所长三角文化数字资产交易平台“乐数通”正式首发
2025-08-02 19:24:00
寻找会“讲故事”的声音展品! 三诺AI+智造博物馆老物件征集活动进行中
导语:在你的记忆中,是否有这样一些物件,它们曾用独特的“声音”在时光里留下印记?或许是流淌着咿呀戏曲的老式收音机,是旋转时沙沙低语的黑胶唱片
2025-08-02 19:24:00
8月1日晚,倍轻松(股票代码:688793.SH)发布公告,将“信息化升级建设项目”的节余募集资金,用于面向实感交互智能的传感器矩阵搭建与应用研究
2025-08-02 19:24:00
近日,重庆中京云智人工智能科技有限公司宣布完成数千万天使轮融资。本轮资金将重点投入核心项目“京店长”的技术研发与全国布局
2025-08-02 19:24:00
当家 APP 与龙牌集团达成战略合作,共筑家装行业新生态
7月30日上午,国内领先的互联网装修平台当家APP与建材行业龙头企业北新建材龙牌集团正式签署战略合作协议。双方宣布将在龙骨
2025-08-02 19:24:00
即小评丨“混搭”潮出圈 蚂蚁市集何以成为即墨“新地标”?
大众网记者 朱晓娟 青岛报道“混搭”一词来源于时尚界,从服饰营销策略扩展到一种文化符号,特指通过巧妙的平衡的协调,创造出新颖
2025-08-02 14:19:00
创新服务企业模式,为数字资产保护提供新的解决方案河北开具首张数据知识产权公证存储证明河北日报讯(记者马彦铭)7月28日
2025-08-02 08:54:00
石家庄食草堂文化饰品有限公司总经理牛睿仪:“选择一行,就要脚踏实地干下去”7月,牛睿仪又打卡了三个城市。作为石家庄食草堂文化饰品有限公司总经理
2025-08-02 09:01:00