• 我的订阅
  • 科技

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

类别:科技 发布时间:2024-07-19 17:21:00 来源:浅语科技

快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。

针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。

随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。

阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。

通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。

ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。

为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。

比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。

在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。

此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。

在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。

零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。

小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

【本文结束】如需转载请务必注明出处:快科技

责任编辑:振亭

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-19 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训
2024-09-19 15:53:00
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2
2025-07-25 21:34:00
一代更比一代强,AI 时代的至强如何为云服务保驾护航?
...(英特尔® SGX)技术提供了应用层面的隔离能力;而在和阿里云的合作中,则由英特尔® TDX 技术与阿里云新实例搭载的可信平台模块(TPM)相配合
2023-12-26 10:08:00
昨天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果
2025-03-07 07:27:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...坚信,2025年一定是中国AI应用爆发的元年。”在4月9日的阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示。他说这话是有底气的——过去一年,阿里云
2025-04-10 17:12:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0
2024-05-22 16:18:00
...的高度关注。该模型名为s1。随后,该模型被曝出是基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型、现成的免费人工智能模型。为了训练s1,研究人员创建了一个仅包含100
2025-02-26 09:09:00
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...超10亿美金融资,投资方包括红杉中国、小红书、美团、阿里等,这是国内大模型公司获得的单轮最大金额融资,最新估值达25亿美元。 月之暗面创始人杨植麟是一位本科毕业于清华、博士
2024-03-23 14:00:00
更多关于科技的资讯:
迅路创新获得数千万元融资,推出定价超五万的高端智能E-cargo bike|36氪首发
作者 | 张子怡编辑 | 彭孝秋36氪获悉,E-cargo bike(载货电助力自行车)厂商迅路创新完成新一轮数千万元融资
2025-08-09 09:26:00
GPT-5快抢走打工人饭碗了
作者:宋思杭GPT-5,终于来了。北京时间8月8日凌晨1点,OpenAI CEO Sam Altman 没有爽约。在发布会前一天
2025-08-09 11:33:00
跻身第一方阵后,合肥还想要更多
作者:李 杭今年年初,DeepSeek的爆火点燃了AI产业与城市发展的新一轮讨论。一个共识逐渐清晰:抓住AI产业风口,城市便能迎来新的增长
2025-08-09 19:56:00
浙江日报讯 (记者 翁云骞 通讯员 邵滢) 最近,墨西哥电子元器件展突然被慈溪外贸企业热捧,参展企业从过去的三五家暴增到四五十家
2025-08-09 09:10:00
汇通达与头部公共云服务商达成全栈AI全面合作宁企牵手阿里云,共拓“AI+产业”新生态□南京日报/紫金山新闻记者张甜甜当AI浪潮涌向乡镇街头巷尾的小店
2025-08-09 09:56:00
江苏南京:“小视”不可小视,一双“慧眼”识世界
十年深耕人工智能视觉领域,让机器“看得懂、想得透、做得准”“小视”不可小视,一双“慧眼”识世界扫一扫,看视频□南京日报/紫金山新闻记者江芬芬站在南京生命科技小镇5号楼的落地窗前
2025-08-09 09:57:00
创新金融服务!交行青岛分行助力青岛“88购物嘉年华”
齐鲁晚报·齐鲁壹点记者 尚青龙消费是拉动经济增长的“主引擎”。8月8日,在2025年青岛“88购物嘉年华”启动之际,交通银行青岛分行以“活水”浇灌消费市场
2025-08-09 11:46:00
8月9日00时31分,“3、2、1,点火!”随着指令落下,熊熊烈焰喷涌而出,托举着捷龙三号运载火箭冲破海天之间的云雾。同一时间
2025-08-09 12:14:00
肥城市消费品以旧换新工作专题新闻发布会召开
新闻发布会现场(鲍文昭 供图)大众网记者 郝晓华 肥城报道近日,肥城市消费品以旧换新工作专题新闻发布会召开。肥城市商务局相关负责人员出席发布会
2025-08-09 15:43:00
国外客户多次登门求购 镇宁破碎机闯全球
“这个月来了三四波国外客商了,刚走的西班牙客户订了1000多万元的设备。”日前,在安顺市镇宁产业园,贵州启黔重工科技有限公司(以下简称“启黔重工”)负责人王大林一边忙着安排生产
2025-08-09 16:11:00
聊城市茌平区聚焦“创新人才”培养的核心命题,在初中物理教学中构建起“一核·三维·五阶”创新素养培育体系。该体系以创新素养为核心
2025-08-09 16:16:00
对话千寻智能高阳:科学家创业不太“靠谱”,但创业就像一场游戏
智能涌现制图具身智能创业,要做苹果,而不是安卓。文|邱晓芬编辑|苏建勋不管是刚刚结束的WAIC(世界人工智能大会),还是本周要开幕的WRC(世界机器人大会)
2025-08-09 08:22:00