• 我的订阅
  • 科技

英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场

类别:科技 发布时间:2023-11-14 14:05:00 来源:搜狐科技
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场

出品 | 搜狐科技

作者 | 梁昌均

在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。

H200此次升级主要体现在带宽更高、容量更大的内存,能以每秒4.8TB的速度提供141GB的内存,而其目前最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。

英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑问,H200将无缘中国市场。

英伟达最强AI芯片,推理性能提升90%

H200是英伟达当前用于训练最先进大语言模型H100芯片的升级产品,它基于英伟达Hopper架构,配备具有先进内存的NVIDIA H200 Tensor Core GPU,可处理生成式AI和高性能计算工作负载的大量数据。

H200还是英伟达第一款使用HBM3e内存的芯片。HBM3E是最新一代的内存规格,可以满足用于AI存储必备的速度,也在发热控制和客户使用便利性等所有方面达到全球最高水平,存储巨头SK海力士、美光等都在布局。

借助内存速度更快、容量更大的HBM3e,英伟达H200以每秒4.8TB的速度提供141GB的内存,与A100相比,容量几乎是其两倍,带宽也提升大43%,从而加速生成式AI和大语言模型,提高高性能计算(HPC)的工作负载。

英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场

内存带宽对HPC应用程序至关重要,因为它可以实现更快的数据传输,减少复杂的处理瓶颈。英伟达表示,对模拟、科学研究和人工智能等内存密集型HPC应用,H200更高的内存带宽可确保高效地访问和操作数据,与CPU相比速度最多可加快110倍。

据英伟达测算,借助H200,1750亿参数的GPT-3的推理速度是H100的1.6倍,700亿参数的Llama2大模型的推理速度则是H100的1.9倍,而高性能仿真计算速度则达到A100的2倍。总体来看,H200由于更强大的内存,更适用于推理,在其用于推理或生成问题答案时,性能较H100提高60%至90%。

英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场

此外,H200和H100两款芯片可以互相兼容。英伟达称,这意味着已经在使用H100进行训练的人工智能公司,不需要改变他们的服务器系统或软件来适应H200。

英伟达大规模与高性能计算副总裁Ian Buck表示,要利用生成式人工智能和高性能计算应用创造智能,必须使用大型、快速的GPU显存,来高速高效地处理海量数据。借助H200,业界领先的端到端人工智能超算平台可以更快解决一些世界上最重要的挑战。

除H200之外,英伟达还发布了HGX H200 平台,这是使用较新加速器的8路 HGX H100 的更新版本。而当H200与英伟达Grace CPU搭配使用时,就组成了性能更为强大的超级计算机GH200 Grace Hopper,其专为大型HPC和AI应用的计算而设计。

英伟达称,在H200加持之下,GH200超级芯片将为全球各地的超级计算中心提供总计约200 Exaflops的AI算力,用以推动科学创新。德国尤里希超级计算中心、筑波大学和东京大学共同成立的日本先进高性能计算联合中心、德克萨斯高级计算中心、伊利诺伊大学香槟分校的美国国家超级计算应用中心等都将利用GH200超级芯片提升计算能力。

此外,英伟达还公布了未来的产品路线图,将使用同一构架设计三款芯片,在明年和后年会继续推出B100和X100,性能有望进一步提升。

明年二季度开始出货,加速与AMD、英特尔竞赛

英伟达表示,H200可以部署在各种类型的数据中心,包括本地、云、混合云和边缘,其全球生态系统合作伙伴服务器制造商(如华硕、戴尔、惠普、联想等)可以利用H200更新其现有系统。

该公司预计,明年第二季度开始出货搭载H200的系统,包括服务器制造商和云服务提供商。除英伟达自己投资的CoreWeave、Lambda和Vultr外,亚马逊云、谷歌云、微软Azure和甲骨文云基础设施将成为首批部署H200的厂商。但显然,H200无法面向中国市场销售,这也将影响其未来销售规模的增长。

目前,全球科技巨头都在囤算力,H100/A100成为抢手货,甚至有公司将其作为融资的抵押物。市场数据显示,今年以来,H100单价高达2.5万至4万美元,而据美国金融机构Raymond James透露,H100芯片成本仅3320美元。目前,英伟达还未公布H200价格。

由于AI大模型往往至少需要数千块GPU,上千亿参数的更大模型则需要更多。马斯克此期称,GPT-5可能需要3万-5万块H100,而摩根士丹利的说法是2.5万个。正是高价格和高需求的同振,让H100成为有史以来最赚钱的一种芯片。

这也推动英伟达业绩暴涨。今年第二季度,英伟达实现营收135亿美元,同比增长101%;净利润达62亿美元,同比更是暴增843%。该公司还预计,三季度将实现营收160亿美元,同比继续增长170%,保持连续两个季度翻倍。

英伟达股价也因此暴涨,成为全球首家超过万亿美元市值的芯片公司,年内股价上涨230%。最新交易日,英伟达股价报486.2美元,市值达1.2万亿美元,是AMD+英特尔市值之和的3倍多。

英伟达推出的H200还被视为应对竞争的最新武器。今年6月,它的老对手AMD发布MI300X系列芯片,最高支持192GB的HBM3内存,内存带宽为5.2TB/s,分别是英伟达H100的2.4倍和1.6倍。这显然给英伟达也带来压力,而此次发布的H200在内存和宽带上仍不及MI300X。

AMD CEO苏姿丰在11月初透露,MI300系列芯片将在未来几周开始出货,并已获得强劲的早期订购,包括大型云计算客户。她预计,该芯片会在四季度带来4亿美元的收入,并有望成为公司史上销售额最快达到10亿美元的产品,2024年全年将超20亿美元。

英特尔同样瞄准了AI算力市场,计划将在明年推出第三代Gaudi AI芯片,并将内存容量从目前的96GB增加到144GB。英特尔Max系列显卡目前内存容量最高为128GB,未来也将继续提升该系列芯片容量。

可以说,面对AI算力市场强劲的需求和市场前景,英伟达、AMD和英特尔等老对手又开启了新竞争。目前,英伟达仍垄断超过90%的AI算力市场,而它的老对手们显然不会让其一家独大。随着更多更强性能产品的推出,这场算力军备竞赛将会持续。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-14 15:45:32

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
算力芯片的火,从2023年一直燃烧到2024年。开年不久,英伟达CEO黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行
2024-01-30 16:23:00
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
昨天凌晨,英伟达发布了2024财年第四季度财报,业绩再次超出预期。但比起亮眼的业绩,更让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟
2024-03-02 13:38:00
ChatGPT掀AI热潮 这些芯片厂商将“狂飙”
...芯片的需求将暴增,给低迷的半导体行业带来一股暖流,英伟达、三星电子、SK海力士等都将受益。但是英伟达服务器用AI芯片方案存在发热和功耗过大的问题,谷歌、亚马逊AWS、三星电子
2023-02-14 14:00:00
黄仁勋:市场对DeepSeek的理解完全错误,算力需求依...
AI(人工智能)芯片龙头英伟达CEO黄仁勋再次回应DeepSeek冲击波,并否定了公司将参与收购英特尔股份的传闻。当地时间3月19日
2025-03-20 15:13:00
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...芯片大决战,不少芯片初创公司跃跃欲试,希望一举打破英伟达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时
2023-11-06 15:12:00
英伟达H20重回市场,但中国芯片过去三个月已爆单
作者丨邱晓芬编辑丨苏建勋为了抢回中国的AI算力市场,英伟达创始人黄仁勋正进行一场意义重大的中国之行。此次黄仁勋行程满满,除了政府侧的拜访,他与小米创始人雷军的合照也已传遍网络。7
2025-07-16 19:39:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...达观数据自家购置一个自己的算力平台,达观数据选择了英伟达DGX高性能工作站方案,相当于英伟达自身做了很多集群优化,解决了存储和网络的大部分问题,直接买GPU卡自建集群和英伟达
2023-06-29 12:00:00
无惧限制 Intel为中国公司定制了一张AI大模型入场券
...赛的入场券。另一层含义是对于英特尔来说,拿出的能和英伟达最先进的H100 GPU比拼的产品,是其在AI大市场里披荆斩棘的入场券,也是一个“大杀器”。站在AI的变革时刻,手握A
2023-07-14 15:42:00
美国25万一张的显卡,禁止向中国供应!
...靡全球后,科技巨头们纷纷入局。而AI的硬件心脏,则由英伟达强势把持着,占据用于机器学习的图形处理器市场的95%。然而,现在英伟达的高性能GPU: A100和H100,都不允许
2023-03-09 17:45:00
更多关于科技的资讯:
电商物流共享给南和宠物食品带来什么——河北特色产业集群共享智造故事(九)漫步邢台市南和区,宠物元素扮靓了街头巷尾。一家家宠物食品公司车间厂区里
2025-12-28 07:44:00
12月26日,位于杭州云栖小镇的国家机器人检测与评定中心(总部)浙江检测中心(以下简称“浙江检测中心”)正式启用。机器人从样机走向量产
2025-12-27 08:10:00
喜报|米糠云顺利通过双ISO体系认证,安全与品质再上新台阶
近日,深圳市米糠云科技有限公司顺利通过ISO27001信息安全管理体系认证与ISO9001质量管理体系认证。这标志着公司在信息安全管理和质量管理方面达到了国际标准
2025-12-27 14:34:00
退货仓分拣 “堵点” 怎么破?快宝共配给出答案
近年来,电商与直播电商的迅猛发展,不仅催生出庞大的正向物流需求,更让逆向物流成为快递行业名副其实的“蓝海”。消费者退换货需求呈爆炸式增长
2025-12-27 14:36:00
京东跨年盛典开启 送好礼官方直降五折起 还能抽祝福“大排面”
岁末迎新,跨年不只是一种仪式,更是一场表达与传递的情感盛宴。京东今年再度打造“年度宠粉”跨年盛典,不仅有众多官方直降5折起的尖货好物
2025-12-27 14:36:00
专为X3D处理器打造,技嘉X870E X3D系列主板全面上线
2025年最热门的CPU毫无疑问当属AMD锐龙X3D系列,而技嘉作为AMD核心合作伙伴之一,专为AMD X3D系列处理器量身定制了X870E X3D系列主板
2025-12-27 14:37:00
58同城2025中国好雇主盛典在深举行,勾勒数智时代雇主价值新坐标
12月26日,58同城2025“中国好雇主”盛典在深圳举办。作为国内极具影响力的雇主品牌盛会,本届盛典以“数智驱动,百业共生”为核心主题
2025-12-27 14:38:00
从“终于有了”到“真的好用”:“山大v卡通”鸿蒙版如何回应期待,定义智慧校园新体验
鲁网12月27日讯“终于有NFC校园卡了,自己的学校必须给个好评!”“NFC终于上了!” 在华为应用商店的评论区,山东大学师生们的真实留言
2025-12-27 17:30:00
想在短视频的蓝海遨游?别错过这部“实战指南”
都说“万物皆可短视频”,哪些内容让你眼前一亮?电筒拍大片、夜空光魔法、特效变装秀、用烘焙复刻文物、把大好河山“穿”在身上……在这个创意无限的世界里
2025-12-27 19:55:00
“新”中有数|福建首张文旅研学领域数据产权登记证书落地福州
福州新闻网12月27日讯(记者 颜澜萍)近日,福州冶城集团所属企业福建百宝图科技有限公司通过福建省大数据集团旗下福建省数据产权登记平台
2025-12-27 21:00:00
12月26日,杭州市市场监督管理局召开专题新闻通气会,对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果
2025-12-27 07:39:00
昨天下午,2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿,大赛共收到来自英国
2025-12-27 07:39:00
杭州市西湖区后陡门58号,原本只是城市边缘一个普通的小村子,仅仅三年,这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间
2025-12-27 07:39:00
装有红酒的纸箱从1米多的高度多次抛下,又被送入抗压测试机内,接受300公斤的压力测试,再经斜面冲击台俯冲撞向铁板,红酒依然完好无损……经过这一系列流程
2025-12-27 07:39:00
近日,智联招聘发布的《2025雇佣关系趋势报告》显示,78.2%的职场人每周至少使用一次AI工具开展工作。该《报告》基于大量调研问卷生成
2025-12-27 07:39:00