• 我的订阅
  • 科技

最强大模型训练芯片H200发布!

类别:科技 发布时间:2023-11-14 20:51:00 来源:瘦子财经

英伟达老黄,带着新一代GPU芯片H200再次炸场。

官网毫不客气就直说了,“世界最强GPU,专为AI和超算打造”。

最强大模型训练芯片H200发布!

听说所有AI公司都抱怨内存不够?

这回直接141GB大内存,与H100的80GB相比直接提升76%。

作为首款搭载HBM3e内存的GPU,内存带宽也从3.35TB/s提升至4.8TB/s,提升43%。

最强大模型训练芯片H200发布!

对于AI来说意味着什么?来看测试数据。

在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。

最强大模型训练芯片H200发布!

对AI公司来说还有一个好消息:

H200与H100完全兼容,意味着将H200添加到已有系统中不需要做任何调整。

最强AI芯片只能当半年

除内存大升级之外,H200与同属Hopper架构的H100相比其他方面基本一致。

台积电4nm工艺,800亿晶体管,NVLink4每秒900GB的高速互联,都被完整继承下来。

甚至峰值算力也保持不变,数据一眼看过去,还是熟悉的FP64Vector33.5TFlops、FP64Tensor66.9TFlops。

最强大模型训练芯片H200发布!

对于内存为何是有零有整的141GB,AnandTech分析HBM3e内存本身的物理容量为144GB,由6个24GB的堆栈组成。

出于量产原因,英伟达保留了一小部分作为冗余,以提高良品率。

仅靠升级内存,与2020年发布的A100相比,H200就在GPT-3175B的推理上加速足足18倍。

H200预计在2024年第2季度上市,但最强AI芯片的名号H200只能拥有半年。

同样在2024年的第4季度,基于下一代Blackwell架构的B100也将问世,具体性能还未知,图表暗示了会是指数级增长。

最强大模型训练芯片H200发布!

多家超算中心将部署GH200超算节点

除了H200芯片本身,英伟达此次还发布了由其组成的一系列集群产品。

首先是HGXH200平台,它是将8块H200搭载到HGX载板上,总显存达到了1.1TB,8位浮点运算速度超过32P(10^15)FLOPS,与H100数据一致。

HGX使用了英伟达的NVLink和NVSwitch高速互联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。

HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。

最强大模型训练芯片H200发布!

接下来是QuadGH200超算节点——它由4个GH200组成,而GH200是H200与GraceCPU组合而成的。

最强大模型训练芯片H200发布!

QuadGH200节点将提供288ArmCPU内核和总计2.3TB的高速内存。

通过大量超算节点的组合,H200最终将构成庞大的超级计算机,一些超级计算中心已经宣布正在向其超算设备中集成GH200系统。

据英伟达官宣,德国尤利希超级计算中心将在Jupiter超级计算机使用GH200超级芯片,包含的GH200节点数量达到了24000块,功率为18.2兆瓦,相当于每小时消耗18000多度电。

该系统计划于2024年安装,一旦上线,Jupiter将成为迄今为止宣布的最大的基于Hopper的超级计算机。

Jupiter大约将拥有93(10^18)FLOPS的AI算力、1EFLOPS的FP64运算速率、1.2PB每秒的带宽,以及10.9PB的LPDDR5X和另外2.2PB的HBM3内存。

最强大模型训练芯片H200发布!

除了Jupiter,日本先进高性能计算联合中心、德克萨斯高级计算中心、伊利诺伊大学香槟分校国家超级计算应用中心等超算中心也纷纷宣布将使用GH200对其超算设备进行更新升级。

那么,AI从业者都有哪些尝鲜途径可以体验到GH200呢?

上线之后,GH200将可以通过Lambda、Vultr等特定云服务提供商进行抢先体验,Oracle和CoreWeave也宣布了明年提供GH200实例的计划,亚马逊、谷歌云、微软Azure同样也将成为首批部署GH200实例的云服务提供商。

英伟达自身,也会通过其NVIDIALaunchPad平台提供对GH200的访问。

硬件制造商方面,华硕、技嘉等厂商计划将于今年年底开始销售搭载GH200的服务器设备。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-15 06:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

745TFLOPS!Tenstorrent推768核RISC-V AI芯片:对标英伟达A100
8月28日消息,由传奇芯片架构师Jim Keller领导的AI芯片新创公司Tenstorrent在近日的Hot Chips 2024活动上详细介绍了其新一代基于RISC-V架构的BlackHole系列AI处理器
2024-08-30 09:52:00
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...点。而大模型要进行推理 Scaling,实际上比训练 Scaling 对芯片并行处理能力的要求更高。 GPU 最初设计用于图形渲染
2024-10-21 09:55:00
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...上海交大演讲时谈到的那样:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往
2024-09-05 09:49:00
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
今年3月,新创AI芯片公司Cerebras Systems推出了其第三代的晶圆级AI芯片WSE-3,性能达到了上一代WSE-2的两倍
2024-09-02 13:36:00
英伟达带来最强AI芯片,但赶超苹果又远了一步?
作者:赵晋杰、编辑:王靖,原标题《英伟达带来最强AI芯片,资本市场却泼了点冷水》,题图来自:视觉中国在股价上呈现追赶苹果之势的英伟达,先在产品上学了苹果一招。北京时间3月19日对
2024-03-19 18:12:00
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
算力芯片的火,从2023年一直燃烧到2024年。开年不久,英伟达CEO黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行
2024-01-30 16:23:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...据等优势,也就最先开始声势浩大的进军大模型。AI算力芯片、服务器/交换机、光模块/光芯片、数据中心、云计算……算力产业链条的每个角色,仿佛齿轮般咬合在一起,构成数字经济的产业
2023-06-29 12:00:00
...邓咏仪 杨逍AI大模型带来的基础设施增量,正在让底层的芯片竞争愈加白热化。领跑的英伟达,如今也面临越来也多对手的追击
2023-08-02 16:13:00
被股民用脚投票!AMD的AI“终极武器”输在了哪里?
...个为AI和HPC(高性能计算)打造的APU加速卡,拥有13个小芯片,总共包含1460亿个晶体管,24个Zen 4 CPU核心
2023-06-14 11:13:00
更多关于科技的资讯: