• 我的订阅
  • 科技

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

类别:科技 发布时间:2023-12-16 13:49:00 来源:芯智讯

12月15日下午,英特尔在中国北京召开了主题为“AI无处不在,创芯无所不及”的2023英特尔新品发布会暨AI技术创新派对,正式发布了代号为“Emerald Rapids”的面向服务器、数据中心的第五代至强可扩展处理器,相比上代至强平均性能提升了21%,能效提升了36%,AI推理性能提升了42%,总拥有成本降低了77%!

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

最高64核心,整体性能提升21%、AI推理性能提升42%、总拥有成本降低77%!

据介绍,第五代至强(Xeon)延续了上代的Intel 7制造工艺、Raptor Cove P-Cove架构、LGA4677封装接口,但在布局设计、部分核心规格上做了升级和增强。

首先在布局设计上,相对于第四代至强的4 Tile Die设计,64核旗舰级的第五代至强采用了2 Tile Die 设计(英特尔将其称之为XCC),这样做有几个好处,即更少的模块意味着更少的数据移动,从而可以降低功耗。不过,虽然Tile的数量更少了,但在物理面积上也更大了。通常情况下,更大的面积意味着更低的产量,但Sapphire Rapids和现在的Emerald Rapids中使用的Intel 7工艺技术在这一点上已经相当成熟。

64核旗舰级的第五代至强每个Tile都通过位于两个核心和缓存阵列之间的模块化裸片结合连接,每个Tile内拥有35个核心(其中3个是禁用的),每个Tile上还拥有2个内存控制器,支持高达5600 MT/s速度的DDR5 DIMM、3个PCIe控制器(共6个)、2个UPI(共4个)和2个加速器引擎(共4个)。

对于较低核心数量的第五代至强处理器,英特尔则继续采用单芯片结构,英特尔称之为中等核心数的芯片(MCC),最多可以有32个核心。还有一种名为EE-LCC的更小的芯片,适用于多达20个核心。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

相比第四代至强来说,第五代至强核心数量由上代的最高60核提升到了64核,并且提供了高达320MB的缓存池,几乎是上代112.5MB的三倍,相当于每核心从1.875MB增至5MB。同时,第五代至强还支持更快的DDR5-5600速度,单路最大容量还是4TB,连接通道则还是80条PCIe 5.0,还支持20 GT/s(千兆传输)带宽的Intel UPI 2.0。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

英特尔表示,与第四代至强相比,第五代至强CPU所能提供的平均性能提升了21%,每瓦平均性能提升36%,TCO(典型的5年刷新周期的总拥有成本)降低了77%。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

在AI能力上,之前的第四代至强就有内置了AMX AI加速器,第五代至强又进一步提升了turbo频率,在某些人工智能推理负载中性能达到了四代至强的高达1.42倍,同时至强目前仍然是唯一一款拥有MLPerf训练和推理基准性能测试的通用CPU。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

根据英特尔之前公布的数据显示,旗舰级第五代64核的Xeon 8592+与前代56核第四代Xeon 8480+相比的AI基准测试,Xeon 8592+在AI语音识别和LAMMPS基准测试中获得了1.4倍的增益,同时在FFMPEG媒体转码工作负载中也获得了1.2倍的增益。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带宽和延迟是主要因素。虽然第五代至强没有整合HMB,但是其也有5600 MT/s DDR5的帮助,虽然速度要差一些,但是已经可以满足一些较小规模的大模型的性能需求,同时在成本上也是远低于那些高昂的AI加速卡。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

英特尔表示,在使用2S 五代至强平台上运行GPT-J 6B模型(60亿参数),它可以实现在大约25毫秒下完成一个Token的处理。不过,对于运行更大的Llama 2 13B模型时,其平均需要的时间则要提升至62ms,但仍远低于100毫秒。另外,有报道显示,目前五代至强已经能够在运行200亿个参数的大模型上实现可接受的延迟。

同时,在第五代五代至强上,QAT快速助手、DLB动态负载均衡器、DSA数据流加速器、IAA存内分析加速器等也依然存在,并且都可以按需付费开启。

客户应用实例方面,IBM watsonx.data平台的网络查询吞吐量提高了2.7倍,Palo Alto Networks的基于深度学习模型的威胁检测性能提升了2倍,Gallium Studios游戏工作室Numenta AI平台的推理性能比GPU云实例提高了多达6.5倍。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

拥有28款SKU

在SKU方面,英特尔第5代至强CPU仅可扩展到1S和2S系统,4S和8S配置不在产品阵容中。其中,旗舰级的Xeon Platinum 8592系列有三种版本,Xeon Platinum 8592+ 用于通用解决方案,Xeon Platinum 8592Q用于液冷和通用解决方案、Xeon Platinum 8592V用于云优化系统。该芯片共有64个内核、128个线程、高达3.90 GHz的睿频、320 MB的L3缓存和385/350/330瓦的TDP。芯片的价格大约在11000美元到12000美元之间。

第五代Xeon Gold系列SKU当中,Xeon Gold 6558Q是最快的SKU,因为它是6548Y+的液冷版本的变体。该芯片有32个内核、64个线程、高达4.1 GHz的睿频、60 MB的缓存和350W的TDP。Xeon Gold 6554S和6530仍然是Gold细分市场中仅有的缓存超过100MB(分别为180和160 MB)的SKU。阵容从8、16、24、28、32、36核不等。

第五代Xeon Silver系列,拥有五个SKU,其中Xeon Silver 4516+最强,拥有24个内核、48个线程、高达3.7 GHz的睿频、45 MB的L3缓存和185W的TDP。所有第五代Xeon Silver SKU均支持DDR5-4400,拥有8、12、16和24核。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

总体来说,五代至强拥有60、56、52、48、36、32、28、24、16、8核心等不同配置,相比四代至强取消了44、40、20、18、12、10核心版本,SKU型号总数也从55款之多精简到28款。第五代至强的最高加速频率范围从1.9-4.2GHz不等来到了3.4-4.1GHz,虽然极限频率低了100MHz,但是总体大大提升,基准频率也从1.7-3.7GHz不等提高到了1.9-3.9GHz。随着性能的提升,第五代至强的整体功耗范围也提升到了150-385W,上代是115-350W。

下一代的Sierra Forest和Granite Rapids

需要指出的是,第五代至强“Emerald Rapids”系列将是为Eagle Stream平台设计的最后一款芯片,之后英特尔便会将至强产品线拆分为与竞争对手类似的注重高性能的全P核和注重高能效的全E核两条产品线。

明年上半年,英特尔将推出基于全新Intel 3制造工艺,纯E核架构的Sierra Forest,也是至强系列第一次引入E核,最多做到288核心288线程。紧随其后的是同样Intel 3制造工艺,纯P核设计的Granite Rapids,但核心数量等规格未披露,将于2024年下半年推出。

英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!

根据英特尔的预告,其未来的Granite Rapids Xeons将在“Intel 3”节点上制造,这些芯片将添加更多的内核、更高的频率、硬件加速,并支持136个PCIe通道,12个8800 MT/s MCR DIMM内存通道,内存总带宽可提高到大约845 GB/s,这将大大有助于LLM推理性能。英特尔声称其人工智能工作负载提高了2-3倍,内存吞吐量提高了2.8倍,DeepMD LAMMPS人工智能推理工作负载提升了2.9倍。

编辑:芯智讯-浪客剑

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-16 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

为AI加速而生 英特尔第五代至强CPU带来AI新表现
...民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。千呼万唤始出来,第五代英特
2023-12-25 19:02:00
搞医学影像,为什么都青睐于CPU?
...公司,在医疗健康领域已深耕多年。这次他们之所以选择英特尔当合作伙伴,正是因为在三维可视化和AI推理这两大性能杀手面前
2024-06-02 15:41:00
CPU,正在被AI时代抛弃?
...高的内存访问带宽。这些需求CPU都可以很好地满足。 以英特尔举例,从2017年第一代至强®可扩展处理器开始就利用英特尔®AVX-512技术的矢量运算能力进行AI加速上的尝试
2024-07-11 16:45:00
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
美国当地时间4月9日,英特尔在面向客户和合作伙伴的英特尔on产业创新大会上,英特尔CEO帕特·基辛格亮出了最新AI芯片——Gaudi 3
2024-04-10 10:52:00
ChatGPT爆火后,如何跳脱算力困局?
英特尔7大算力神器助力极致算力。“请代替基金经理写一段年终总结”,“如何评价春节档电影大混战”,“请写出一段爬取网页内容的程序”……诸如此类问题,OpenAI开发的ChatGPT
2023-02-22 17:40:00
最强服务器CPU来了!AI性能直接翻倍
...务器CPU领域持续多年的核心数量大战,被一举终结了! 英特尔最新发布的至强®6性能核处理器(P-core系列),超越了过去单一维度的竞争,通过“升维”定义了新的游戏规则:
2024-09-27 20:45:00
英特尔推出酷睿Ultra和第五代至强可扩展处理器,让AI无处不在
...间12月15日凌晨,在纽约举行的“让AI无处不在”活动上,英特尔推出一系列出色的AI产品组合,旨在助力用户从数据中心、云、网络,到边缘和 PC等各个领域打造无处不在的AI解决
2023-12-18 13:54:00
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
新一代英特尔® 至强® 可扩展处理器点燃AI加速力。以漫长的人类历史广度为观测点,不难发现,每一轮工业革命都重新定义了社会秩序,创造了更丰富的资源体系。在大数据呈指数级爆发之下,
2023-12-20 19:21:00
一代更比一代强,AI 时代的至强如何为云服务保驾护航?
...端多样化工作负载需求的较强 AI 能力:面对上述需求,英特尔作为服务器 CPU 领域的技术领导者,继年初发布第四代至强® 可扩展处理器之后,加快了产品更新节奏,于上周发布了第
2023-12-26 10:08:00
更多关于科技的资讯:
鲁网1月28日讯走进泰安斯耐特自动化设备有限公司的研发中心与生产车间,科研人员正专注调试高压电气设备智能监测系统,生产线上智能组装设备高效运转
2026-01-29 09:05:00
中国科大构建全球首个核自旋量子传感网络 为搜寻宇宙“隐形邻居”提供工具
大皖新闻讯 近日,中国科大自旋磁共振实验室彭新华教授和江敏教授团队在《自然》杂志发表突破性研究成果:团队革新核自旋量子精密测量技术
2026-01-29 09:26:00
■ 胡蓉摘要:在数字经济快速发展的背景下,营销活动的数字化、智能化和平台化已成为企业提升市场竞争力的重要途径。相较于民营企业和互联网企业
2026-01-29 04:48:00
探店1天|“两个月投入8000元”,年轻人迷上花滑,啥情况?
中新经纬1月28日电 (李自曼)“重心往下,感觉你的刀刃!起身,张开双臂保持平衡……”在冰场中央,花滑教练王子誊一边说着
2026-01-28 23:33:00
江南时报讯 2025年,泰州农商银行秉持“以客户为中心”的理念,深入开展“运营服务满意年”专项活动,以创新驱动、网点提质
2026-01-28 21:53:00
山东移动日照分公司圆满完成2025年银行金融跨年结算通信保障工作
鲁网1月28日讯近日,日照移动公司全力组织人员保障网络工作,顺利完成市县银行系统52家网点的网络保驾护航工作,圆满完成网络通信保障
2026-01-28 22:01:00
科技赋能传统酿造 引领产业数智变革——中科恒信人工智能上甑机器人及发酵食品高端装备项目投产
鲁网1月28日讯近日,记者走进中科恒信智能科技(泰安)有限公司人工智能上甑机器人及发酵食品高端装备项目的智能装备车间,大族激光切割机精准作业
2026-01-28 17:21:00
第四届MUST Awards顺利举办,科技行业年终盛典收官
1月22日,第四届MUST Awards麻瓜青年选择奖在杭州成功举办。作为国内首个由科技内容创作者与大众消费者共同投票评选的消费科技奖项
2026-01-28 17:46:00
宇树科技官方:关于2025年销量数据的澄清
1月22日晚,宇树科技官方微信公众号发布了一份关于2025年销量数据的澄清。宇树强调,过去一个月,网上流传着很多关于宇树2025年出货数量的不实信息
2026-01-28 17:52:00
潮新闻与传播大脑发布“178”方案 打造主流媒体系统性变革的“浙江样本”
大皖新闻讯 1月28日,“三生万物 AI如潮涌”潮新闻&传播大脑三周年联合发布会在浙江杭州体育场路178号浙江日报报业集团举行
2026-01-28 17:54:00
遵义人的年味天花板来了!2026新春年货全网剧透,逛吃玩拿一站齐!
来源:遵义晚报一审:余旭二审:王信 姚腾三审:唐全寿
2026-01-28 18:05:00
中国消费者报北京讯(记者王小月)1月27日,中国连锁经营协会发布2025年度中国购物中心行业景气度报告。当前,购物中心经营仍面临诸多挑战
2026-01-28 18:10:00
2026中关村早期投资论坛暨AI新场景产业创新大会在京举行
1月28日,由中关村天使投资联盟、海创汇、北京前沿国际人工智能研究院、铅笔道、AC加速器联合主办的“2026中关村早期投资论坛暨AI新场景产业创新大会”在北京市海淀区中关村国家自主创新示范区展示中心成功举办
2026-01-28 18:15:00
中国蓝新闻讯 在宁波余姚,一批企业敏锐抓住全球冰雪运动热潮,通过科技创新与产品升级,积极开拓海外市场,让“中国智造”的体育用品走向世界
2026-01-28 18:23:00
中国蓝新闻综合 近日,宇树科技正式官宣成为中央广播电视总台2026年春晚机器人合作伙伴,这是其继2021年牛年春晚、2025年蛇年春晚后第三次登上这一国民级舞台
2026-01-28 18:23:00