• 我的订阅
  • 科技

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

类别:科技 发布时间:2024-07-19 17:21:00 来源:浅语科技

快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。

针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。

随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。

阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。

通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。

ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。

为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。

比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。

在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。

此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。

在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。

零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。

小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

【本文结束】如需转载请务必注明出处:快科技

责任编辑:振亭

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-19 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训
2024-09-19 15:53:00
一代更比一代强,AI 时代的至强如何为云服务保驾护航?
...(英特尔® SGX)技术提供了应用层面的隔离能力;而在和阿里云的合作中,则由英特尔® TDX 技术与阿里云新实例搭载的可信平台模块(TPM)相配合
2023-12-26 10:08:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0
2024-05-22 16:18:00
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...超10亿美金融资,投资方包括红杉中国、小红书、美团、阿里等,这是国内大模型公司获得的单轮最大金额融资,最新估值达25亿美元。 月之暗面创始人杨植麟是一位本科毕业于清华、博士
2024-03-23 14:00:00
阿里大模型,再次开源大放送
阿里大模型,再次开源大放送——发布Qwen1.5版本,直接放出六种尺寸。最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Evalv2上
2024-02-20 14:45:00
阿里云AI基础设施获2024世界互联网大会领先科技奖
11月19日,2024年世界互联网大会领先科技奖在乌镇揭晓,阿里云面向AI的云计算基础设施荣获该奖,成为世界互联网大会史上首个以AI基础设施整体获奖的科技成果。面向AI时代,阿里
2024-11-19 18:59:00
大模型降价背后,国产大模型的竞争逻辑变了
...动率先将大模型的使用价格,调低至“厘”时代,百度、阿里、腾讯等巨头纷纷跟进,迅速将大模型推至免费时代。大模型免费时代加速到来5月15日,火山引擎云服务平台,发布了国内首批通过
2024-05-29 09:29:00
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max
2024-09-20 13:33:00
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面
2023-11-14 16:05:00
更多关于科技的资讯: