• 我的订阅
  • 科技

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

类别:科技 发布时间:2024-07-19 17:21:00 来源:浅语科技

快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。

针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。

随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。

阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。

通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。

ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。

为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。

比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。

在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。

此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。

在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。

零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。

小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

【本文结束】如需转载请务必注明出处:快科技

责任编辑:振亭

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-19 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
9月24日,2025云栖大会,阿里巴巴集团CEO吴泳铭宣布阿里云重磅升级全栈AI体系,实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命,阿里云将全力打造成为全栈人工智
2025-09-24 13:30:00
阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训
2024-09-19 15:53:00
11月25日,阿里巴巴集团发布2026财年第二季度业绩,在旺盛的AI需求推动下,阿里云整体收入同比强劲增长34%,其中AI相关产品收入连续9个季度实现三位数同比增长。本季度,通过
2025-11-25 20:38:00
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2
2025-07-25 21:34:00
阿里千问最强模型重磅亮相!性能媲美GPT-5.2、Gemini 3 Pro
1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录,性能媲美GPT-5
2026-01-27 07:38:00
一代更比一代强,AI 时代的至强如何为云服务保驾护航?
...(英特尔® SGX)技术提供了应用层面的隔离能力;而在和阿里云的合作中,则由英特尔® TDX 技术与阿里云新实例搭载的可信平台模块(TPM)相配合
2023-12-26 10:08:00
昨天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果
2025-03-07 07:27:00
阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为其1/18
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型
2026-02-16 17:34:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
更多关于科技的资讯:
两会,就这Young!丨万亿存量市场怎么激活?全国人大代表郭兴田用“两天”作答
编者按:今年全国两会,大河网两位00后记者首次踏上两会征程,以“萌新”视角记录两会,为网友带来全新体验:不背稿、不装样
2026-03-10 14:21:00
让家陪伴成长——金隅天坛家居Mall 3月7日启幕,定义“家生活”新方式
在快速更迭的时代,人们对家的期待已超越功能满足,转而追求情感承载与成长陪伴。正是基于这一洞察,金隅天坛家居Mall提出“我家的长期主义”核心主张——让家能够伴随家庭成长
2026-03-10 14:26:00
在教育选择中,高途网课是否靠谱、教育机构是否可靠、办学是否正规,是学习者和家长最为关注的核心问题。高途 2025 财年第四季度及全年财报
2026-03-10 14:27:00
文化认同融入创新表达,“欢笑中国年”如何抓住大众情绪的小切口?
2026 年春节,红包大战再度迎来内卷与爆发,随着AI平台扎堆涌入,用户在春节期间的注意力被分散、现金激励的边际效应减弱
2026-03-10 16:50:00
灵寿县:灵活就业AI分析让求职成功率提升25%
“把这次春风行动搜集到的信息尽快录入系统,用AI分析一下,精准做好匹配。”3月8日,灵寿县零工市场有关负责人张杉认真梳理了上一场“春风行动”收集到的用工求职信息
2026-03-10 11:30:00
杭州的人形机器人太超前 德国留学生专程为它来学习
近日,浙江科技大学机器人现代产业学院实验室里,来自德国德累斯顿技术经济大学的硕士研究生马克西米利安·穆勒正在开展关于宇树人形机器人的毕业论文研究
2026-03-10 11:36:00
大皖新闻讯 连日来,“养龙虾”成为一大热词。这里的龙虾不是水产,而是一款名为OpenClaw的开源AI智能体,因其图标是亮眼的红色龙虾
2026-03-10 13:41:00
新发路观察·两会特别报道|瞪羚样板背后的吉林创新力
今年全国两会上,瞪羚企业创新力再成热门话题。从数字经济到先进制造,从新材料到生物医药,一批又一批瞪羚企业脱颖而出……以创新破局
2026-03-10 13:46:00
当“移动蓝”邂逅“咖啡香”:中国移动江苏公司携手宜兴高职校,打造创业实践新样本
近日,位于宜兴人民南路139号的中国移动服务厅内,飘出了浓郁的咖啡香。备受关注的“电大咖啡”在这里正式开门迎客。这家由宜兴高等职业技术学校学生自主运营
2026-03-10 11:40:00
拥抱OpenClaw生态,途牛MCP开放平台正式上线
江南时报讯 3月9日,途牛对外发布正式上线MCP(Model Context Protocol)开放平台,面向AI Agent与个人助理(如OpenClaw)提供一站式旅游服务能力接口
2026-03-10 11:08:00
厦门网讯(厦门日报记者 林露虹)将智能马桶的外观调为柔和的粉色,以优化感官体验提升产品附加值;从个人护理细分赛道切入,构建服务女性的全品类矩阵……这些创新举措
2026-03-10 08:20:00
奋进的河北|共享智造 集群焕新
编者按安平丝网远销190多个国家和地区,肃宁乐器年产逾百万件……各具优势的县域特色产业,为燕赵大地高质量发展注入澎湃活力
2026-03-10 08:32:00
临海市人工智能创新发展大会日前举行,现场集中签约12个人工智能重点合作项目,涵盖智能制造等领域,标志着这座千年古城在竞逐人工智能新赛道上按下“加速键”
2026-03-10 08:33:00
3月7日上午,浙江代表团小组审议现场,全国人大代表、温州医科大学校长李校堃分享了一个数据:2025年我国创新药对外授权交易合同总金额超过1300亿美元
2026-03-10 08:34:00
近日,央视财经《银发经济走进城市|上海行》播出,聚焦上海在银发经济领域的创新实践。节目通过走访企业和行业代表,观察科技与服务模式如何满足老年群体日益增长的精神文化需求
2026-03-10 08:51:00