• 我的订阅
  • 科技

阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至

类别:科技 发布时间:2024-05-22 16:18:00 来源:21世纪经济报道

5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。

此次降价深入AI领域。业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国头部的云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

降价来到大模型

在阿里巴巴集团CEO、阿里云董事长兼CEO吴泳铭确定阿里云“AI驱动、公共云优先”的战略后,阿里云的降价力度更大,仅2024年开局,已经有过三次降价。

阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至

2月29日,阿里云宣布中国区全线降价,100多款、500多种规格的产品直降20%,最高降幅55%;3月31日,8款阿里云热销云产品登上罗永浩直播间,直播间主打两款基础云服售价低于1折;4月8日,阿里云宣布海外市场全线降价,平均降幅为23%,最高降幅为59%。

本次,阿里云终于将降价带向了备受关注的大模型。据悉,通义千问本次降价共覆盖9款商业化及开源系列模型,涵盖Qwen-Long、Qwen-Max、Qwen1.5-72B等。

其中,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。

阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至

相比之下,目前国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元,均远高于Qwen-long。

至于Qwen-Long的输入价格比输出降得更多的原因,刘伟光表示,是因为用户在提问时经常结合长文本,导致模型的输入调用频率通常高于输出调用频率。统计数据显示,模型的输入调用频率大约是输出的8倍。

他表示,通过大幅降低用户使用量最大的输入token的价格,对企业而言更具成本效益,有助于实现更广泛的普及。此外,将输入价格降低,也是为了鼓励大家充分利用长文本。

而刚刚发布的旗舰款大模型Qwen-Max,其API输入价格降至0.04元/千tokens,降幅67%。它是目前业界表现最好的中文大模型之一,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15。

此次降价的力度如此之大,刘伟光表示,这得益于公共云的技术红利和规模效应,带来的巨大成本和性能优势。阿里云从模型和AI基础设施两个层面不断优化,追求极致的推理成本和性能。例如,阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

大模型爆发前夜

业内人士认为,近期海内外模型厂商不约而同调低价格,不仅仅是一种市场策略,更是大模型应用时代到来的一个明显信号。降价背后,公有云厂商正利用大模型技术带来的红利,作为其在市场上竞争的有力武器,且推动整个行业向更智能化、更高效的方向发展。这种策略,无疑将成为公有云厂商在激烈市场竞争中的重要优势之一。

刘伟光表示,2004年中国的大模型在起步阶段,所有公司加起来的日调用量可能不超过1亿次API调用。然而,根据目前的发展情况和客户增长数据,到2024年年底,整个API市场的日调用量将达到100亿次,未来可能还会有成千上百倍的增长。

这种增长的信心来自于几个方面:移动支付和短视频等垂直领域的发展已经证明了大模型在语音、图像和文本等方面的能力,这些能力正在渗透到社会的每个角落。其次,技术能力的不断提升和推理成本的不断下降,以及市场应用的爆发式增长趋势,都是推动这一增长的重要因素。

刘伟光认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。

一是公共云的技术红利和规模效应,带来巨大的成本和性能优势。即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。一般情况下,自建集群需要考虑的成本有集群硬件采购、软件部署、网络费用、电费,及硬件折旧、人力成本等,如果出现计算资源闲置或超载等情况,还需要付出额外成本;而在云上调用大模型API真正实现了随用随取,按需使用。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

二是云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。

三是云厂商天然的开放性,能为开发者提供更丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

在业内人士看来,以阿里云为代表的云厂商通过降价策略,降低了企业使用大模型的成本,也加速了大模型技术的普及和商业化进程。更多的企业将享受到大模型带来的智能化服务和决策支持,以实现更高效的运营模式和更强大的竞争力。

“今天看到全国的市场各种类型的客户不断拥抱大模型,相信在成千上百倍增加的背后,一定会大幅度再次稀释成本,从而不断地推动价格的下降,实现AI应用的爆发。”刘伟光表示。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-22 17:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大模型开启“免费午餐”?字节直降99%,阿里一折甩卖,百度高喊免费!
...价降低99.3%。几天后,阿里、百度纷纷跟上,阿里官宣9款通义大模型降价,通义千问GPT-4级大模型Qwen-Long直降97%
2024-05-22 15:38:00
科大讯飞业界首推永久免费大模型,讯飞星火Lite今起免费用
...型下调了价格,掀起价格战。近日,阿里云宣布旗下9款通义大模型降价,百度也紧随其后,宣布文心大模型两大主力模型ERNIE Speed 和ERNIE Lite 全面免费
2024-05-22 14:29:00
5月28日,记者从阿里云青岛AI峰会上获悉,阿里云通义大模型大降价不到一周,已得到企业和开发者的积极响应,有头部企业的调用量翻了100倍。一周前,阿里云在武汉AI峰会上宣布通义9
2024-05-29 10:39:00
阿里云AI绘画创作大模型来了!我们测了测“通义万相”的神通
本文转自:浙江日报潮新闻 记者 祝梅“通义千问”不能文生图?这可能是它“兄弟”的技能。7月7日,在上海召开的2023世界人工智能大会上
2023-07-07 19:00:00
如视与阿里通义实验室达成合作,共赴数实融合新未来
...你所视(北京)科技有限公司(以下简称为“如视”)与阿里通义实验室(以下简称为“通义实验室”)达成合作。双方在三维采集和重建领域有着共同的目标和愿景,通过本次合作,如视与通义实
2024-03-20 19:35:00
大模型“免费”送,厂商们图什么?
...个汉字,比行业便宜99.3%。一周后,阿里云也对外宣布,通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0
2024-06-05 10:57:00
电商之外,阿里的另一场反击!
...用户的购买率和忠诚度。融合了阿里自家大语言模型的“通义千问”的客服机器人可以无缝、无障碍地与用户进行多媒体互动,包括文字聊天、语音通话等,最大程度减少人工客服的工作量和工作压
2024-06-13 10:52:00
大模型时代的阿里云,将云计算进行到底
...时代最开放的云。”在现场,周靖人发布了千亿级参数的通义千问2.0,但更多的时间花在公布云计算基础能力的进展上:包括AI基础设施的全面升级、模型应用开发平台阿里云百炼以及更加自
2023-11-01 12:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
更多关于科技的资讯: