• 我的订阅
  • 科技

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

类别:科技 发布时间:2023-11-14 13:41:00 来源:新智元
英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

英伟达的节奏,越来越可怕了。

就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200!

较前任霸主H100,H200的性能直接提升了60%到90%。

不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更换成最新的H200。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

全世界的AI公司都陷入算力荒,英伟达的GPU已经千金难求。英伟达此前也表示,两年一发布的架构节奏将转变为一年一发布。

就在英伟达宣布这一消息之际,AI公司们正为寻找更多H100而焦头烂额。

英伟达的高端芯片价值连城,已经成为贷款的抵押品。

至于H200系统,英伟达表示预计将于明年二季度上市。

同在明年,英伟达还会发布基于Blackwell架构的B100,并计划在2024年将H100的产量增加两倍,目标是生产200多万块H100。

而在发布会上,英伟达甚至全程没有提任何竞争对手,只是不断强调「英伟达的AI超级计算平台,能够更快地解决世界上一些最重要的挑战。」

随着生成式AI的大爆炸,需求只会更大,而且,这还没算上H200呢。赢麻了,老黄真的赢麻了!

141GB超大显存,性能直接翻倍!

H200,将为全球领先的AI计算平台增添动力。

它基于Hopper架构,配备英伟达H200 Tensor Core GPU和先进的显存,因此可以为生成式AI和高性能计算工作负载处理海量数据。

英伟达H200是首款采用HBM3e的GPU,拥有高达141GB的显存。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

与A100相比,H200的容量几乎翻了一番,带宽也增加了2.4倍。与H100相比,H200的带宽则从3.35TB/s增加到了4.8TB/s。

英伟达大规模与高性能计算副总裁Ian Buck表示——

要利用生成式人工智能和高性能计算应用创造智能,必须使用大型、快速的GPU显存,来高速高效地处理海量数据。借助H200,业界领先的端到端人工智能超算平台的速度会变得更快,一些世界上最重要的挑战,都可以被解决。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

跟前代架构相比,Hopper架构已经实现了前所未有的性能飞跃,而H100持续的升级,和TensorRT-LLM强大的开源库,都在不断提高性能标准。

H200的发布,让性能飞跃又升了一级,直接让Llama2 70B模型的推理速度比H100提高近一倍!

H200基于与H100相同的Hopper架构。这就意味着,除了新的显存功能外,H200还具有与H100相同的功能,例如Transformer Engine,它可以加速基于Transformer架构的LLM和其他深度学习模型。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

HGX H200采用英伟达NVLink和NVSwitch高速互连技术,8路HGX H200可提供超过32 Petaflops的FP8深度学习计算能力和1.1TB的超高显存带宽。

当用H200代替H100,与英伟达Grace CPU搭配使用时,就组成了性能更加强劲的GH200 Grace Hopper超级芯片——专为大型HPC和AI应用而设计的计算模块。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

下面我们就来具体看看,相较于H100,H200的性能提升到底体现在哪些地方。

首先,H200的性能提升最主要体现在大模型的推理性能表现上。

如上所说,在处理Llama 2等大语言模型时,H200的推理速度比H100提高了接近1倍。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

因为计算核心更新幅度不大,如果以训练175B大小的GPT-3为例,性能提升大概在10%左右。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

显存带宽对于高性能计算(HPC)应用程序至关重要,因为它可以实现更快的数据传输,减少复杂任务的处理瓶颈。

对于模拟、科学研究和人工智能等显存密集型HPC应用,H200更高的显存带宽可确保高效地访问和操作数据,与CPU相比,获得结果的时间最多可加快110倍。

相较于H100,H200在处理高性能计算的应用程序上也有20%以上的提升。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

而对于用户来说非常重要的推理能耗,H200相比H100直接腰斩。

这样,H200能大幅降低用户的使用成本,继续让用户「买的越多,省的越多」!

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

上个月,外媒SemiAnalysis曾曝出一份英伟达未来几年的硬件路线图,包括万众瞩目的H200、B100和「X100」GPU。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

而英伟达官方,也公布了官方的产品路线图,将使用同一构架设计三款芯片,在明年和后年会继续推出B100和X100。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

这次,英伟达更是在官方公告中宣布了全新的H200和B100,将过去数据中心芯片两年一更新的速率直接翻倍。

以推理1750亿参数的GPT-3为例,今年刚发布的H100是前代A100性能的11倍,明年即将上市的H200相对于H100则有超过60%的提升,而再之后的B100,性能更是望不到头。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

至此,H100也成为了目前在位最短的「旗舰级」GPU。

如果说H100现在就是科技行业的「黄金」,那么英伟达又成功制造了「铂金」和「钻石」。

云服务方面,除了英伟达自己投资的CoreWeave、Lambda和Vultr之外,亚马逊云科技、谷歌云、微软Azure和甲骨文云基础设施,都将成为首批部署基于H200实例的供应商。

此外,在新的H200加持之下,GH200超级芯片也将为全球各地的超级计算中心提供总计约200 Exaflops的AI算力,用以推动科学创新。

在SC23大会上,多家顶级超算中心纷纷宣布,即将使用GH200系统构建自己的超级计算机。

德国尤里希超级计算中心将在超算JUPITER中使用GH200超级芯片。

这台超级计算机将成为欧洲第一台超大规模超级计算机,是欧洲高性能计算联合项目(EuroHPC Joint Undertaking)的一部分。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

Jupiter超级计算机基于Eviden的BullSequana XH3000,采用全液冷架构。

它总共拥有24000个英伟达GH200 Grace Hopper超级芯片,通过Quantum-2 Infiniband互联。

每个Grace CPU包含288个Neoverse内核, Jupiter的CPU就有近700万个ARM核心。

它能提供93 Exaflops的低精度AI算力和1 Exaflop的高精度(FP64)算力。这台超级计算机预计将于2024年安装完毕。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

由筑波大学和东京大学共同成立的日本先进高性能计算联合中心,将在下一代超级计算机中采用英伟达GH200 Grace Hopper超级芯片构建。

作为世界最大超算中心之一的德克萨斯高级计算中心,也将采用英伟达的GH200构建超级计算机Vista。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

伊利诺伊大学香槟分校的美国国家超级计算应用中心,将利用英伟达GH200超级芯片来构建他们的超算DeltaAI,把AI计算能力提高两倍。

此外,布里斯托大学将在英国政府的资助下,负责建造英国最强大的超级计算机Isambard-AI——将配备5000多颗英伟达GH200超级芯片,提供21 Exaflops的AI计算能力。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

GPU竞赛,也进入了白热化。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

面对H200,而老对手AMD的计划是,利用即将推出的大杀器——Instinct MI300X来提升显存性能。

MI300X将配备192GB的HBM3和5.2TB/s的显存带宽,这将使其在容量和带宽上远超H200。

而英特尔也摩拳擦掌,计划提升Gaudi AI芯片的HBM容量,并表示明年推出的第三代Gaudi AI芯片将从上一代的 96GB HBM2e增加到144GB。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

英特尔Max系列目前的HBM2容量最高为128GB,英特尔计划在未来几代产品中,还要增加Max系列芯片的容量。

所以,H200卖多少钱?英伟达暂时还未公布。

要知道,一块H100的售价,在25000美元到40000美元之间。训练AI模型,至少需要数千块。

此前,AI社区曾广为流传这张图片《我们需要多少个GPU》。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

GPT-4大约是在10000-25000块A100上训练的;Meta需要大约21000块A100;Stability AI用了大概5000块A100;Falcon-40B的训练,用了384块A100。

根据马斯克的说法,GPT-5可能需要30000-50000块H100。摩根士丹利的说法是25000个GPU。

Sam Altman否认了在训练GPT-5,但却提过「OpenAI的GPU严重短缺,使用我们产品的人越少越好」。

英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%

我们能知道的是,等到明年第二季度H200上市,届时必将引发新的风暴。

(来源:新智元)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-14 15:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达rtx4060ti显卡8g与16g版游戏性能基本相同
英伟达现已发布RTX4060Ti显卡,有8GB显存和16GB显存两个版本可选,前者售价3199元起,5月24日上市;后者3899元起
2023-05-22 13:45:00
英伟达正在准备三款rtx40super显卡
据报道,英伟达正在准备三款GeForceRTX40SUPER显卡,分别是RTX4080SUPER、RTX4070TiSUPER和RTX4070SUPER
2023-10-27 10:23:00
英伟达考虑缩减geforcertx5090显卡尺寸
...息,消息源@kopite7kimi昨日转发overclock3d媒体报道,透露称英伟达考虑缩减GeForceRTX5090FoundersEdition显卡尺寸
2024-05-30 08:25:00
英伟达rtx4070tisuper改用更强悍显存模块
5月20日消息,TecLab&PauloGomes团队改造英伟达GeForceRTX4070TiSUPER显卡
2024-05-20 10:45:00
英伟达rtx50系列移动端gpu芯片阵容遭泄露
根据wccftech的最新报道,英伟达(NVIDIA)旗下备受期待的GeForceRTX50系列移动端GPU芯片阵容遭遇泄露
2024-06-10 20:04:00
消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存
IT之家 3 月 18 日消息,英伟达将在明日举行 GTC 2024 主题演讲,黄仁勋预计将宣布名为 Blackwell 的下一代 GPU 架构
2024-03-18 09:44:00
英伟达gb202和gb203显卡即将上市
近日,有消息称英伟达的GB202和GB203GPU已经成功流片,这意味着RTX5090和RTX5080显卡即将推出市场
2024-06-02 16:50:00
三星成为英伟达gddr7显存供应商
...,三星电子在与SK海力士和美光的竞争中胜出,成功成为英伟达下一代GeForceRTX50"Blackwell"显卡的GDDR7显存供应商
2024-11-27 02:15:00
2025开年 黄仁勋扔出一串王炸
...意义上“闪亮全场”的鳄鱼皮夹克,似乎也暗示了今晚的英伟达将非比寻常。在短短数语回顾了英伟达在GPU行业的成绩后,RTX 50系列显卡当仁不让地打了头阵。简单概述就是,该系列产
2025-01-08 00:18:00
更多关于科技的资讯:
全产业链展示秀出硬实力 “集优品·向辛行”2025辛集国际皮革盛会开幕
河北新闻网8月2日讯(侯淼、毛宇)今天,2025外贸优品中华行(辛集专场)暨辛集国际皮革皮草时装周、中国(辛集)国际皮毛时装博览会在辛集国际皮革城正式开幕
2025-08-02 21:44:00
7月31日下午,一场科技与美学的奇幻碰撞正在上演,孩子们的手指轻划屏幕,一件又一件充满设计感的服装瞬间“穿”在虚拟模特身上
2025-08-02 08:14:00
250万元撬动2000万元!六盘水:“小”券激活“大”经济
7月31日晚七点,金鸿购物超市人潮涌动。王女士的购物车里放着刚挑选好的榴莲和小龙虾,手机里一张“满100减30”的消费券即将核销
2025-08-02 13:57:00
德州扒鸡:在传承与创新中焕发新生
鲁网8月2日讯(记者 吴美琳 实习记者 费书慧)8月1日,德州市举行第二场“产业链上的山东好品牌”系列记者见面会,邀请山东德州扒鸡股份有限公司副董事长
2025-08-02 14:13:00
从清晨到日暮 恩博力以“冠军标准”定义健康家居新体验
(广告)在碧波与奖牌的背后,一位花样游泳世界冠军的日常,由无数个对细节的精准把控和对健康的不懈追求构筑而成。作为恩博力品牌代言人
2025-08-02 14:25:00
深国际·太原智慧物流制造项目主体完工
8月2日,深国际·太原智慧物流制造项目主体建设已经完工,目前,正在进行内部平台的改造,部分设备已进场。
2025-08-02 18:21:00
振健科技布局全国八大直营生产基地,引领行业高质量发展
近日,广东振健生物科技股份有限公司(以下简称:振健科技)宣布,企业已在全国范围内成功建立八大直营生产基地,主要分布在广州
2025-08-02 19:24:00
《聊斋志异·崂山道士》系列数字资产首发上线乐数通
由人民美术出版社正版授权,云栖博悟(杭州)文化传播有限公司设计发行的首款文化数字资产——《聊斋志异·崂山道士》,于2025年7月31日在浙江文化产权交易所长三角文化数字资产交易平台“乐数通”正式首发
2025-08-02 19:24:00
寻找会“讲故事”的声音展品! 三诺AI+智造博物馆老物件征集活动进行中
导语:在你的记忆中,是否有这样一些物件,它们曾用独特的“声音”在时光里留下印记?或许是流淌着咿呀戏曲的老式收音机,是旋转时沙沙低语的黑胶唱片
2025-08-02 19:24:00
8月1日晚,倍轻松(股票代码:688793.SH)发布公告,将“信息化升级建设项目”的节余募集资金,用于面向实感交互智能的传感器矩阵搭建与应用研究
2025-08-02 19:24:00
近日,重庆中京云智人工智能科技有限公司宣布完成数千万天使轮融资。本轮资金将重点投入核心项目“京店长”的技术研发与全国布局
2025-08-02 19:24:00
当家 APP 与龙牌集团达成战略合作,共筑家装行业新生态
7月30日上午,国内领先的互联网装修平台当家APP与建材行业龙头企业北新建材龙牌集团正式签署战略合作协议。双方宣布将在龙骨
2025-08-02 19:24:00
即小评丨“混搭”潮出圈 蚂蚁市集何以成为即墨“新地标”?
大众网记者 朱晓娟 青岛报道“混搭”一词来源于时尚界,从服饰营销策略扩展到一种文化符号,特指通过巧妙的平衡的协调,创造出新颖
2025-08-02 14:19:00
创新服务企业模式,为数字资产保护提供新的解决方案河北开具首张数据知识产权公证存储证明河北日报讯(记者马彦铭)7月28日
2025-08-02 08:54:00
石家庄食草堂文化饰品有限公司总经理牛睿仪:“选择一行,就要脚踏实地干下去”7月,牛睿仪又打卡了三个城市。作为石家庄食草堂文化饰品有限公司总经理
2025-08-02 09:01:00