• 我的订阅
  • 科技

Intel为中国带来Gaudi2 AI加速器:超高性价比!

类别:科技 发布时间:2023-07-12 16:29:00 来源:瘦子财经

毫无疑问,这是一个全民AI的时代。

如果你不能张口ChatGPT、闭口大模型,都不好啥意思跟人打招呼。

如果你不在AI上搞点东西,都不好意思说自己是科技企业。

当然了,AI的历史其实相当悠久,远不只是对个话、做个图那么简单。

无论是云侧还是端侧,无论是生成式还是决策式,无论硬件还是算法,无论是训练推理还是应用场景,都是相当深奥的学问。

想真正做好AI,基础硬件、开发软件、生态场景都缺一不可,必须高效、合理地处理各种各样的数据、模型、应用,真正落到使用。

能有如此综合实力的企业屈指可数,Intel无疑就是一个典型标杆,从云到端都有丰富的AI解决方案,CPU通用处理器、GPU加速器、AI加速器任君按需选择。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

7月11日,Intel在中国举办了IntelAI产品战略暨Gaudi2新品发布会,正式面向中国市场推出第二代深度学习加速器——HabanaGaudi2。

IntelGaudi2加速器不但拥有极高的深度学习性能、效率,最大优势就是极高的性价比,对于中国用户来说堪称大规模部署AI的上佳之选。

Intel执行副总裁兼数据中心与人工智能事业部总经理SandraRivera在发布会上表示:“Intel致力于通过为客户提供广泛的硬件选择,并支持开放的软件环境,加速AI技术的发展。凭借包括至强可扩展处理器、Gaudi2深度学习加速器在内的产品组合,Intel正在降低AI的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国AI的未来。”

Intel为中国带来Gaudi2 AI加速器:超高性价比!

HabanaLabs成立于2016年,致力于研发世界一流的AI加速器,满足人工智能、深度学习计算快速发展的需求,创业初期就得到了Intel的投资,2019年12月被Intel正式收购。

Habana的第二代加速器Gaudi2采用台积电7nm工艺制造,集成24个可编程的Tenor张量核心(TPC)、48MBSRAM缓存、21个10万兆内部互连以太网接口(ROCEv2RDMA)、96GBHBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等,支持PCIe4.0x16,最高功耗800W。

基于Gaudi2加速器芯片,Intel还设计了夹层卡HL-225B,采用标准的OAM封装接口,方便客户部署与使用。

凭借高性能和高效扩展性,Gaudi2加速器可以满足大规模语言模型、生成式AI模型的强算力需求。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

Intel为中国带来Gaudi2 AI加速器:超高性价比!

↑↑↑Gaudi2加速器正面实拍

Intel为中国带来Gaudi2 AI加速器:超高性价比!

↑↑↑Gaudi2加速器背面实拍(这个角度不多见吧)

Gaudi系列加速器优异的深度学习训练吞吐量、推理速度性能,已经得到了业界领先机构、客户的普遍认可。

比如,正是在第一代Gaudi加速器的加持下,亚马逊EC2DL1实例相比于在AWS云上运行NVIDIAGPU的同类实例,性价比高出多达40%。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

↑↑↑Gaudi2加速器现场演示多语言算法编程

机器学习与人工智能开放产业联盟MLCommons在六月底公布的AI性能基准测试MLPerfTraining3.0的最新结果,更是进一步凸显了Gaudi2加速器的高性能、高性价比,联合Intel第四代至强可扩展处理器,已经成为唯一能够可靠取代NVIDIAGPU的方案。

截止2023年6月,Gaudi2是除了NVIDIAH100GPU以外,向GPT-3大模型训练基准提交性能结果的解决方案。

测试结果显示,面对要求极为苛刻的、1750亿参数的GPT-3模型,384个Gaudi2加速器上的训练时间仅为311.9分钟,而且从256个加速器到384个加速器,性能扩展幅度达95%,非常接近理想的线性提升。

StableDiffusion训练上,Gaudi2加速器从1张卡到64张卡,扩展性更是达到了惊人的99%。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

此外,在计算机视觉模型ResNet-50(8个加速器)和Unet3D(8个加速器),以及自然语言处理模型BERT(8个和64个加速器)上,Gaudi2都取得了优异的训练结果。

与去年11月提交的数据相比,BERT和ResNet模型的性能分别提高了10%、4%。

值得一提的是,本次MLPerf3.0的Gaudi2结果以BF16数据类型提交,在四种不同模型上的性能均优于NVIDIAA100,价格更便宜。

第三季度还会发布对FP8数据类型的软件支持与新功能,预计届时Gaudi2的性能将有明显飞跃,预计性价比将超越NVIDIAH100。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

Gaudi2加速器还得到了AI与机器学习开源软件供应商HuggingFace的采纳。

其测试结果显示,从预训练BERT(NLP模型)到稳定扩散(流行的多模态模型)推理,再到1760亿参数的大型开源聊天模BLOOMZ的推理,Gaudi2的表现都领先于NVIDIAA100GPU。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

Intel为中国带来Gaudi2 AI加速器:超高性价比!

工欲善其事,必先利其器。为了充分发挥Gaudi2加速器的性能潜力,满足日益增长的生成式AI、大语言模型需求,Intel一直在同步打造高效、成熟的软件支持。

比如说SynapseAI软件套件,针对Gaudi平台深度学习业务进行了优化,可以大大简化模型的开发与迁移,能够将当前基于GPU的模型业务和系统,快速迁移到基于全新Gaudi2的服务器

SynapseAI集成了对TensorFlow、PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求

Intel为中国带来Gaudi2 AI加速器:超高性价比!

生态合作方面,IntelGaudi2加速器也正在遍地开花。

本次发布会上,美团、百度智能云、浪潮信息均分享了其基于Intel软硬件产品组合的多样化智能业务进展。

比如百度智能云,集成AMX加速引擎的Intel第四代至强可扩展处理器,为ERNIE-Tiny模型带来了多倍的性能优化。

比如浪潮信息,正式发布了全新的AI服务器NF5698G7,6U高度,上层集成八颗Gaudi2加速器,互连总带宽达4.2Tb/s,下层双路56核心第四代至强可扩展MAX处理器,支持AMX、DSA等AI加速器。

整体为全互联拓扑结构,支持业界主流AI框架、开发工具、大模型算法,可满足大模型训练张量并行数百GB/s的通信需求。

该服务器还有极高的扩展性,节点间互连带宽最高达4800Gbps,支持RDMA网络计算和存储通信,并提供多达32条DDR5内存插槽、12条PCIe5.0x16扩展插槽。

此外,新华三、超聚变等也都是IntelGaudi在中国的合作伙伴,生态规模正艺逐步扩大。

Intel为中国带来Gaudi2 AI加速器:超高性价比!

Intel为中国带来Gaudi2 AI加速器:超高性价比!

↑↑↑可安装八颗Gaudi2加速器

Intel为中国带来Gaudi2 AI加速器:超高性价比!

↑↑↑双路四代至强处理器

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-12 18:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi2加速器
近日,英特尔专门针对中国市场推出深度学习加速器Habana® Gaudi®2.以领先的性价比优势,加速AI训练及推理,提高深度学习性能和效率,从而成为大规模部署AI的更优解。作为
2023-07-19 18:00:00
英特尔发布中国特供版7nm AI芯片Gaudi2,减少RDMA接口以符合出口管制规定|硅基世界
...面向中国市场、采用台积电7nm工艺的第二代Gaudi深度学习加速器Habana Gaudi2。新的Gaudi2可便捷扩展
2023-07-12 16:00:00
Intel正式发布Gaudi 3 AI加速器:1200W功耗!性价比两倍于NVIDIA H100
早在4月份,Intel就宣布了新一代AI加速器Gaudi 3,现在它终于发布了,详细的规格参数也已出炉,竞争对手直指NVIDIA H100 GPU加速器
2024-09-26 10:01:00
ai生命周期:ai训练和ai推理的完美结合
...规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时候根据情况也可以使用超高性能的CPU处理器。AI推理则是基于训练好的模型,实时处理输入的数
2024-03-15 02:13:00
...内初创领域的最新发展趋势、以及关于亚马逊云科技创业加速器的细节。顾凡谈到:亚马逊云科技在中国的整整10年,完整见证了中国企业出海范式和路径的升级。这个路径升级,简单说就是由实
2023-07-03 10:20:00
国产高端医学装备上新了,人工智能装备最抢眼
...州等地投入运行或建设。装置采用“回旋注入器+同步主加速器”技术,可用于有效治疗普通放疗设备难以治疗的恶性肿瘤,副作用小,安全性较高。装置小型紧凑,技术先进、性价比高,运维成本
2025-03-15 11:00:00
无惧限制 Intel为中国公司定制了一张AI大模型入场券
...模型训练结果的半导体解决方案。结果显示,Gaudi2在384个加速器上训练GPT-3的时间为311分钟,英伟达在512个H100 GPU上的训练时间则为64分钟
2023-07-14 15:42:00
三个月之内 Intel CEO连续访华:长期扎根中国 关键看行动
...商领袖和前高官对话,还是在中国市场推出第二代Gaudi AI加速器、推进中美青年创客大赛,基辛格和Intel的一系列举措
2023-07-17 15:49:00
钛媒体科股早知道:华为云推出首个大模型混合云,全球加速云计算战略部署
...液冷技术因其低能耗、高散热、低噪声等优势,成为兼具性价比和高效的温控手段。按照赛迪顾问预测,随着AIGC和数据要素加速发展,高功率单机柜将迅速普及,预计2025年,全球数据中
2023-12-01 10:02:00
更多关于科技的资讯: