• 我的订阅
  • 财经

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

类别:财经 发布时间:2024-05-27 15:27:00 来源:财经风云

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。

实际上,硅谷也在上演着类似的情形。记者注意到,硅谷大模型的价格也出现了下降趋势。

API价格战首先在OpenAI和谷歌这对“老对手”之间展开,不过幅度相对较小。其中,OpenAI的GPT-4o调用API的价格比GPT-4-turbo降低了一半,为5美元/百万Tokens,谷歌Gemini1.5Flash的价格降到了0.35美元/百万Tokens。

到底是什么在左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?硅谷在“拼”什么?

5月中旬,字节跳动豆包以0.0008元/千Tokens的价格直接将国内大模型的市场价格带入“厘时代”。随即,大模型厂商便开始了价格上的角力。百度甚至直接祭出“文心大模型两大主力模型全面免费”的大招,直接将“价格战”推向新的高度。科大讯飞、腾讯等也“坐不住”了,要么降价,要么免费。

短短数天,国内大模型企业的混战便从“低价”走向了“免费”。而在硅谷,类似的情形其实也在上演。

记者注意到,实际上,降低API价格和推升AI推理速度也已逐渐成为硅谷各大模型提供商的竞争焦点。

API价格战首先是在OpenAI和谷歌这对“老对手”之间展开的。当地时间5月13日,OpenAI发布全新模型GPT-4o,该模型支持免费试用,据传未来将供用户免费试用。此外,调用GPT-4oAPI的价格比GPT-4-turbo降低了一半,为5美元/百万Tokens。

在第二天的谷歌全球开发者大会上,谷歌宣布当家王牌Gemini大模型系列之一Gemini1.5Flash的API价格为0.35美元/百万Tokens,远低于GPT-4o的价格。

比GPT-4o更具性价比的还有硅谷当红AI初创公司Anthropic和MistralAI模型的API价格。

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

图片来源:每经制图

除了“拼”模型调用价格,有媒体指出,硅谷AI芯片公司正以加快模型推理速度——即每秒生成Token的数量——以吸引客户。例如,美国芯片厂商Groq公司专注于提高每秒生成Token的数量,以此作为其主要的市场竞争点。

据科技外媒Medium今年4月的报道,Groq最新的AI芯片在Meta的开源模型LLaMA3上达到了惊人的每秒生成800个token,并称这“标志着AI推理效率和能力的巨大转变”。截至目前,英伟达一直主导着AI芯片市场。该报道分析认为,Groq的最新成就可能将对英伟达的统治地位构成严峻挑战。

根据Groq的数据,许多开源模型据称在Groq芯片上的运行速度都得到提升,例如,Mixtral8×7B版本每秒输出500个Token;Llama270B版本每秒输出300个Token。

记者查询数据发现,当前配备英伟达芯片处理的硅谷热门大模型推理速度远低于此。例如,GPT-4Turbo每秒生成约48个token,GPT-4为每秒约10个token;谷歌的Gemini1.5Pro约为每秒54.2个token。

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

图片来源:每经制图API“价格战”背后:模型性能差距正在减小

硅谷为何也会面临大模型的API“价格战”问题?这主要是跟模型的性能有关。

上个月,纽约大学知名教授GaryMarcus发表了一篇名为《证据表明LLM正达到收益递减点》的文章,驳斥了宾夕法尼亚大学沃顿商学院教授EthanMollick的一个观点,后者声称目前对大型语言模型改进率的最佳估计显示,能力每5~14个月翻一番。

GaryMarcus认为,从某些指标来看,在2020~2023年间,大模型的能力的确遵照上述定律翻了一番,但在过去13个月里这种情况并未发生。“相反,我看到许多迹象表明我们已经进入了收益递减期。”他这样写道。

若以MMLU(一种常见的大模型基准指标)为基准,可以看到,从GPT-2到GPT3再到GPT-4呈现了飞跃式的递增,但GPT-4到今年4月发布的GPT-4Turbo的能力改进并不明显。

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

图片来源:《证据表明LLM正达到收益递减点》

其次,自GPT-4发布以来,硅谷各大模型的能力正在趋同。LiquidAI的机器学习科学家MaximeLabonne在X平台上表示,表现最好的闭源模型(GPT-4级别)和开源模型在性能上的差距正在越来越小。

硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?

图片来源:X平台

与此同时,随着企业对定制化大模型的需求越来越高,硅谷科技公司正在推出一系列小模型,例如微软在4月推出了名为Phi-3Mini的轻量级模型。TheInformation分析称,像Phi这类小型模型的激增可能会削弱OpenAI的主导地位。

据TheInformation,微软产品团队已经将内置的GPT-4换成开源模型,以在Bing等产品中执行更基本的任务。而最初为OpenAI大模型支付高价的一些公司,近期开始转向包括开源模型在内的更便宜的竞争对手。

随着GPT-4之后模型能力的趋同,以及更多开源模型和小模型的出现,竞争加剧之下,高价大模型的降价似乎是一种必然。“卷”价格、“卷”速度并非终点

然而,一味“卷”价格会有未来吗?

众所周知,算力成本是开发大模型无法绕过的难点之一。根据斯坦福大学HAI研究所今年发布的AI报告,训练巨型模型的成本呈指数级增长,谷歌GeminiUltra的训练成本估计为1.91亿美元,GPT-4的训练成本估计为7800万美元。

据报道,Anthropic的CEO此前曾表示,目前正在训练的模型成本已接近10亿美元,到2025年和2026年,将飙升至50亿或100亿美元。

科技巨头已经在硅谷大模型领域建立牢固的立足点,前沿基础模型市场呈现出强烈的市场集中化趋势。分析认为,价格战持续下去,公司利润势必被挤压,财力雄厚的科技巨头尚有基础,但初创公司则可能面临风险。

对于大模型公司来说,提升模型性能才是赢得竞争的最终手段。正如GaryMarcus所讲,如果收益递减的趋势持续,低级错误无法修正,大模型可能永远无法到达黄金时段。

另一方面,对于芯片厂商来说,“卷”每秒生成Token的数量仍然更多只是一种噱头,缩短第一个Token生成的时间或将成为下一个新的竞争点。

尽管Medium分析认为,每秒生成Token数量的提高等同于推理能力的上升,但硅谷AI公司SambaNova在5月初发表的一篇博客文章中表示,当涉及到一些较为复杂和繁重的长文本任务时,每秒生成Token数量并非最重要的指标,也不能全面反映大模型的推理性能。而相对地,第一个Token生成的时间才更加重要。

这篇文章直白地指出,对每秒高Token数量的追求可能是一种“炒作”。尽管其确实可以实现令人印象深刻的解码速度,但存在芯片利用率低,第一个Token生成速度较慢,难以处理较长的文本输入等重大缺点。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-27 21:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

显卡可能没那么重要了 中国公司给硅谷好好上了一课
...做了AI 界拼多多。他们还进一步引发了国内大模型公司的价格战,诸如智谱、字节、阿里、百度、腾讯等大厂纷纷降价。池光耀也告诉我们,他们公司早在去年 6 、 7 月份就开始用上了
2025-01-03 06:44:00
大模型降价背后,国产大模型的竞争逻辑变了
...明,国内大模型科技公司开启了价格比拼模式。一方面,价格战有利于巨头抢占更多客户资源,从而迅速扩大市场份额,使其在市场竞争中保持领先地位。随着大模型用户和场景的不断扩大,模型调
2024-05-29 09:29:00
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...元人民币。”陈巍说。算力的旺盛需求让上游厂商打响了价格战。4月26日,阿里云宣布核心产品价格全线下调15%至50%,存储产品最高降幅达50%,这是阿里云史上最大规模降价。“这
2023-05-09 10:37:00
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...访谈。在一个小时的对话中,李彦宏对开源闭源、大模型价格战、智能体、超级应用、AGI等业界热点问题,表达了自己的看法。李彦宏认为,开源其实是一种智商税。“当你理性地去想,大模型
2024-07-31 16:00:00
本文转自:劳动报国产大模型打响“价格战”业内人士称今年迎来“AI应用爆发元年”■劳动报记者 陈宁 在刚刚结束的春季功能更新会上,OpenAI宣布了其最新模型GPT-4o,不仅
2024-05-23 02:54:00
大模型价格战谁会受益
从讳莫如深到开诚布公,大模型价格战开打两个月,从业者主动或被动地参与其中,7月4日—6日举办的2024世界人工智能大会期间,大模型价格战依然是热门话题,但参与各方强调的不再是价格
2024-07-08 00:43:00
大模型价格战“卷”向何方?|深度
...腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战,以惯有的免费模式先聚集用户与开发者。中小大模型创业公司普遍还在勒紧腰带苦苦打造爆款应用,也不得不匆忙接招。大模型价格
2024-05-25 10:34:00
大模型卷向下半场:价格战之后如何成为真正“刚需”
...。而从今年5月开始,在几家大型厂商的带领下,大模型价格战愈演愈烈,国内“百模大战”步入新阶段。6月3日,澎湃新闻正式推出一线财经大调研直播——《超级公司》。首期走进国内一线人
2024-06-04 08:03:00
本文转自:劳动报大模型“价格战”重塑行业生态应用市场定价或受影响■劳动报记者 陈宁近期,一场由互联网巨头引领的大模型“价格战”在业内引发轩然大波。记者注意到,其连锁效应已逐渐渗
2024-05-29 00:15:00
更多关于财经的资讯:
2026元旦档电影总票房破5亿元
据网络平台数据,截至1月2日14时58分,2026年元旦档档期(1月1日—1月3日)总票房破5亿。日前,国家电影局发布贺岁元旦档电影片单
2026-01-02 22:22:00
贵州日报天眼新闻记者 鲍贝贝编辑 李雪雪二审 李姗三审 岳振
2026-01-02 05:20:00
· 冰雪经济持续升温 点燃冬季文旅消费新热潮
央广网北京1月1日消息 据中央广播电视总台经济之声报道,元旦假期,冰雪游成为市场亮点。各地不断探索“冰雪+”新场景,通过一张“雪票”串联起餐饮
2026-01-02 07:05:00
浙股2025盘点 17家浙企A股上市 杭州占4席
2025年A股IPO市场暖意渐浓,在这一轮资本市场复苏浪潮中,浙江企业交出亮眼答卷。截至2025年12月30日,全年共有17家浙企成功登陆A股市场
2026-01-02 08:37:00
2026年A股投资策略前瞻:延续慢牛 多主线共振
随着2025年步入尾声,国泰基金、中欧基金等公募机构,以及德邦证券、东兴证券等多家券商相继发布2026年度投资策略报告
2026-01-02 10:16:00
2025杭州二手房年度数据出炉
2025年度杭州二手房市场的“成绩单”出炉了。据杭州我爱我家数据,过去一年,杭州市区(含富阳、临安)二手房成交总量约8
2026-01-02 08:37:00
2025天下贵州人年度影响力人物丨贵医附院移植科主任潘光辉
二十年来,他为一条又一条生命完成移植接力,他用精湛的医术在贵州医学空白处点亮第一束光。他用承诺守护生命尊严,不让任何人因为困难而失去重生的希望。贵州日报天眼新闻记者 朱登芳 杨学
2026-01-01 21:01:00
2025天下贵州人年度影响力人物丨乔治队长咖啡创始人彭近洋
从事咖啡事业十年,他从贵阳走向世界,获得2025年世界咖啡冲煮大赛冠军。他让贵州咖啡的香味飘向全球,此后以创新赋能产业,用品牌反哺贵州,让世界都知道贵州的咖啡风味。贵州日报天眼新
2026-01-01 21:02:00
2025天下贵州人年度影响力人物丨衡昌烧坊董事长张家豪
在茅台镇边建起酒店,带领衡昌烧坊转型。他不仅立志于酿造美酒,更致力于打造一种美好的生活方式。从“卖产品”到“卖生活方式”,他走在了一条崭新的销售之路上。贵州日报天眼新闻记者 李姗
2026-01-01 21:02:00
A股11连阳收官 沪指年内涨18% 每10只股票就有一只翻倍
A股2025年收官虽然没能跨过4000点大关,但沪指迎来11连阳(含12月30日一根假阳线),全年累计上涨18.41%
2026-01-02 08:37:00
“i茅台”1499元飞天茅台上线半小时售罄 自营网点:线下暂无现货
大皖新闻讯 2026年1月1日上午9时,消费者屏息凝神,手指悬停在手机屏幕上。当“i茅台”APP上“购买”的按钮亮起的瞬间
2026-01-01 20:47:00
2025天下贵州人年度影响力人物丨凤岗县蓝天救援队队长叶林广
他是母亲眼中的好儿子,儿子眼中的好父亲,但在榕江险情到来时,他奔赴榕江,用一根绳索从悬崖旁拉起生的希望。坚持奋战一夜,为百名乡亲点亮归途,他是平凡人却做出了不凡事。贵州日报天眼新
2026-01-01 21:01:00
元旦假期已至,春节也越来越近,消费市场呈现出的“鲜味”越来越足。从抢鲜上市的新品种蔬果、鲜活的现捕海鲜到提早上市的早茶
2026-01-02 07:06:00
新业态、新供给澎湃假日文旅消费新动能 文化之美“百花齐放”添彩元旦假期
央视网消息:跨年夜,全国多地钟鼓齐鸣、烟花盛放,人们祈福祝愿,喜迎2026。在新疆伊犁昭苏县,骏马踏雪奔腾,冰雕点亮夜色
2026-01-02 07:05:00
他在大山中坚守二十年,用足球教育女孩,原来读书不是唯一的一条出路,足球也可以获得成功。他让一朵朵原本只能在大山中仰望星空的山花,走向世界。贵州日报天眼新闻记者 陈露 杨学安编辑
2026-01-01 21:01:00