• 我的订阅
  • 科技

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

类别:科技 发布时间:2023-06-30 22:24:00 来源:浅语科技

最新MLPerf训练基准测试中,H100GPU在所有的八项测试中都创下了新纪录!

如今,NVIDIAH100几乎已经统治了所有类别,并且是新LLM基准测试中使用的唯一的GPU。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

3,584个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。

MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。

LambdaLabs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

11分钟训出GPT-3的怪兽是如何构成的

在LLM和BERT自然语言处理(NLP)基准测试中排名最高的系统,是由NVIDIA和InflectionAI联合开发。

由专门从事企业级GPU加速工作负载的云服务提供商CoreWeave托管。

该系统结合了3584个NVIDIAH100加速器和896个IntelXeonPlatinum8462Y+处理器。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

因为英伟达在H100中引入了新的Transformer引擎,专门用于加速Transformer模型训练和推理,将训练速度提高了6倍。

CoreWeave从云端提供的性能与英伟达从本地数据中心运行的AI超级计算机所能提供的性能已经非常接近了。

这得益于CoreWeave使用的NVIDIAQuantum-2InfiniBand网络具有低延迟网络。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

随着参与训练的H100GPU从数百个扩展到3000多个。

良好的优化使得整个技术堆栈在要求严苛的LLM测试中实现了近乎线性的性能扩展。

如果将GPU的数量降低到一半,训练相同的模型时间会增加到24分钟。

说明整个系统的效率潜力,随着GPU的增加,是超线性的。

最主要的原因是,英伟达从GPU设计之初就考虑到了这个问题,使用NVLink技术来高效实现了GPU之间的通信。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

在参与测试的90个系统中,有82个系统都使用了英伟达的GPU进行加速。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

单卡训练效率

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

系统集群训练时间对比

英特尔参加测评的系统使用64到96个不等的IntelXeonPlatinum8380处理器和256到389个不等的IntelHabanaGaudi2加速器。

然而,英特尔提交的GPT-3的训练时间为311分钟。

成绩和英伟达相比就稍微有点惨不忍睹了。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

分析师:英伟达优势过大

行业分析师认为,英伟达的在GPU上的技术优势是非常明显的。

而它作为AI基础设施提供商,在行业中的主导地位还体现在英伟达多年建立起来的生态系统粘性上。

AI社区对英伟达的软件的依赖性也非常强。

几乎所有AI框架都基于英伟达提供的底层CUDA库和工具。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

而且它还能提供全堆栈的AI工具和解决方案。

除了为AI开发人员提供支持之外,英伟达还继续投资用于管理工作负载和模型的企业级工具。

在可预见的未来,英伟达在行业的领先地位将会非常稳固。

分析师还进一步指出。

MLPerf测试结果中所展现的,NVIDIA系统在云端进行AI训练的强大功能和效率,才是英伟达「战未来」的最大本钱。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

下一代AdaLovelace GPU,2025年发布

Tom'sHardware自由撰稿人ZhiyeLiu也于近日发文,介绍了下一代英伟达AdaLovelace显卡的计划。

H100训练大模型的能力,毋庸置疑。

只用3584个H100,短短11分钟内,就能训练出一个GPT-3模型。

在最近的新闻发布会上,英伟达分享了一份新路线图,详细介绍了下一代产品,包括GeForceRTX40系列AdaLovelaceGPU的继任者,而前者,是当今最好的游戏显卡。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

根据路线图,英伟达计划在2025年推出「AdaLovelace-Next」显卡。

如果继续沿用当前的命名方案,下一代GeForce产品应该是作为GeForceRTX50系列上市。

根据南美黑客组织LAPSU$得到的信息,HopperNext很可能被命名为Blackwell。

在消费级显卡上,英伟达保持着两年一更新的节奏。

他们在2016年推出了Pascal,在2018年推出了Turing,在2020年推出了Ampere,在2022年推出了AdaLovelace。

如果这次AdaLovelace的继任者会在2025年推出,英伟达无疑就打破了通常的节奏。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

最近的AI大爆发,产生了对英伟达GPU的巨大需求,无论是最新的H100,还是上一代的A100。

根据报道,某大厂今年就订购了价值10亿美元的NvidiaGPU。

尽管有出口限制,但我国仍然是英伟达在全世界最大的市场之一。

(据说,在深圳华强北电子市场,就可以买到少量英伟达A100,每块售价为2万美元,是通常价格的两倍。)

对此,英伟达已经对某些AI产品做了微调,发布了H100或A800等特定SKU,以满足出口要求。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

ZhiyeLiu对此分析道,换个角度看,出口法规其实是有利于英伟达的,因为这意味着芯片制造商客户必须购买更多原版GPU的变体,才能获得同等的性能。

这也就能理解,为什么英伟达会优先考虑生成计算GPU,而非游戏GPU了。

最近的报道显示,英伟达已经增加了计算级GPU的产量。

没有面临来自AMD的RDNA3产品堆栈的激烈竞争,英特尔也没有对GPU双头垄断构成严重威胁,因此,英伟达在消费侧可以拖延。

11分钟训完gpt-3,英伟达横扫mlperf8项基准测试

最近,Nvidia通过GeForceRTX4060和GeForceRTX4060Ti,将其GeForceRTX40系列产品堆栈又扩大了。

GeForceRTX4050以及顶部的RTX4080Ti或GeForceRTX4090Ti等,都有潜力。

如果迫不得已,英伟达还可以从旧的Turing版本中拿出一个产品,更新AdaLovelace,给它封个「Super」待遇,进一步扩展Ada阵容。

最后,ZhiyeLiu表示,至少今年或明年,Lovelace架构不会真正更新。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-01 08:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达h100gpu在mlperf基准测试创造6项新记录
11月9日消息,英伟达今天发布新闻稿,表示旗下的H100GPU在MLPerf基准测试中创造了6项新记录。IT之家今年6月报道
2023-11-10 02:18:00
英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练
...产业联盟MLCommons披露两项MLPerf基准评测的最新数据,其中英伟达H100芯片组在人工智能算力表现的测试中
2023-06-28 07:00:00
英伟达h100gpu再创多项新纪录
6月14日消息,英伟达旗下的H100GPU仍在AI市场独占鳌头,现阶段没有出现威胁其主导地位的竞争对手,在MLPerf最新基准测试中
2024-06-15 03:42:00
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。当然,答案通常都偏向于英伟
2024-09-05 09:49:00
英伟达rtx4080super基准测试结果泄露
1月25日消息,英伟达(NVIDIA)GeForceRTX4080SUPERGPU的首个基准测试结果已经泄露,测试结果显示其性能与非SUPER版相近
2024-01-26 04:22:00
Databricks推出目前最强开源 AI
...RX在整体成绩方面发挥较好,不过目前该模型需要使用4块英伟达H100GPU运行,因此还有待优化空间。
2024-04-01 12:06:00
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...夜,谷歌(Google)、AMD先后上新,终于要“打爆”OpenAI和英伟达了。钛媒体App 12月7日消息,北京时间今天凌晨
2023-12-07 13:02:00
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...源模型(如GPT-4o)的表现并不一致。为了改变这一现状,英伟达的研究团队最近宣布推出NVLM 1.0,在视觉-语言任务上取得了最先进的成果
2024-09-24 13:36:00
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理
2024-09-07 09:48:00
更多关于科技的资讯:
像导游一样的前台、会直播的销售 去酒店上班,也要懂自媒体运营
今年,杭州的酒店屡上热搜,先是酒店外摆卖美食,再是40元打包酒店自助餐……那些“第一个吃螃蟹”的酒店借着流量火了一波,证实了酒店在公域耕耘的重要性
2025-12-29 08:42:00
解码当下流行文化:腾讯QQ流行文化观察(2025)
卷首语从通讯工具到数字生活空间当我们在2025年审视QQ,看到的早已不是一个简单的即时通讯应用。它更像一座自然形成的数字城市
2025-12-29 08:43:00
“数据合规与保护专业能力评价”首次考试圆满举行
2025年12月27日,由中国计算机行业协会主办的“数据合规与保护专业能力评价”首次考试顺利举行,作为国内第一个数据合规领域的标准化能力评价考试
2025-12-29 09:13:00
中新经纬12月29日电 据韩联社报道,韩国电商巨头酷澎(Coupang)创始人、其美国母公司酷澎Inc.董事会主席金范锡(音)12月28日就近期引起广泛关注的用户信息外泄事件首次公开致歉
2025-12-29 10:16:00
2025年,兴业银行石家庄分行以“安愉人生”养老金融服务品牌为核心,围绕“生态构建、服务升级、安全守护”三大维度发力,全方位推进养老金融高质量发展
2025-12-29 10:29:00
做用户信赖的智家服务守护者——记泰安联通岱岳分公司夏张营业部王景峰
鲁网12月29日讯泰安联通岱岳夏张营业部智家工程师王景峰,坚守装维服务一线,以精益求精的服务态度、扎实过硬的专业能力,成为用户口中“信得过
2025-12-29 11:02:00
预计年产值20亿元!杭州新开工项目,2028年投用!
近日,杭州赋厨人工智能产业发展有限公司新建AI+智能厨电研发及生产项目正式开工建设。据悉,该项目位于杭州富春湾新城,总投资10亿元
2025-12-29 08:11:00
RUA RUA PANDA大熊猫主题全球巡展伦敦站期间,来自德国、法国、荷兰的粉丝专程“打飞的”到Bamboo Zoo快闪店抢购侦探熊猫
2025-12-29 07:40:00
中新经纬12月27日电 据“网信中国”微信号,27日,国家互联网信息办公室起草了《人工智能拟人化互动服务管理暂行办法(征求意见稿)》
2025-12-28 09:18:00
杭州发放10000张无门槛停车券!今天开抢
好消息:2025年12月28日至2026年1月3日,连续7天,“杭州停车”微信小程序将每天放出停车优惠券,总计10000张
2025-12-28 11:45:00
以安全智造引领行业高质量发展
坐落于青岛胶州市上合示范区的海尔上合冰箱互联一工厂,是海尔自创立以来在全球投资最大、智能化程度最高、产业链配套最完整、生态体系最健全的安全生产标杆项目
2025-12-28 15:05:00
永辉南京首家胖东来模式新店落户江宁宝龙,万达茂店焕新压轴开业
岁末钟声渐近,金陵城中,两处商业地标正悄然点亮品质生活的新图景。12月29日,永辉超市南京江宁宝龙广场店将盛大开业,这是永辉在南京全新开设的首家胖东来模式门店
2025-12-28 21:29:00
AIGC视听产业人才新生态大会在京举办
中国青年报客户端讯(中青报·中青网记者余冰玥)12月27日,2025首创郎园AIGC视听产业人才新生态大会在北京举办。面对AI创作人才日益年轻化
2025-12-28 21:31:00
国际热核聚变实验堆ITER计划校正场线圈采购包任务在合肥竣工交付
大皖新闻讯 12月28日,由中国科学院合肥物质科学研究院等离子体物理研究所(以下简称合肥物质院等离子体所)承担的国际热核聚变实验堆ITER计划校正场线圈采购包圆满完成全部的制造任务
2025-12-28 15:14:00
江南时报讯 12月27日,以“智赋江苏,聚势腾飞”为主题的2025江苏省人工智能产业发展大会在南京举行。大会设置江苏“人工智能+”创新成果展区
2025-12-28 21:23:00