我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
6月27日消息,科技博客ChipsandCheese于6月25日发布博文,详细测试了AMDMI300XGPU,并在高速缓存、延迟、推理等方面对比后发现,性能远超英伟达的H100。
MI300X简介
AMDInstinctMI300X人工智能加速器基于CDNA3架构打造,采用混合的5nm和6nm制程工艺,最多拥有1530亿晶体管。
存储方面也获得了巨大提升,MI300X的HBM3容量比上一代的MI250X(128GB)高出50%。
与英伟达H100相比,MI300X拥有以下优势:
内存容量高出2.4倍
内存带宽高出1.6倍
FP8性能(TFLOPS)高出1.3倍
FP16性能(TFLOPS)高出1.3倍
在1v1对比测试中,性能方面可领先H100(Llama270B)最多20%
在1v1对比测试中,性能方面可领先H100(FlashAttention2)最多20%
在8v8服务器对比测试中,性能方面可领先H100(Llama270B)最多40%
在8v8服务器对比测试中,性能方面可领先H100(Bloom176B)最多60%
高速缓存
AMDMI300X配备了32KBL1缓存、16KB标量缓存、4MBL2缓存和一个巨大的256MBInfinityCache(作为L3缓存)。
hipsandCheese的缓存基准测试表明,在所有相关缓存级别中,MI300X的缓存带宽都大大优于Nvidia的H100。
一级缓存性能显示MI300X的带宽是H100的1.6倍,二级缓存的带宽是H100的3.49倍,MI300X的最后一级缓存(即无限缓存)的带宽是H100的3.12倍。
显存带宽
AMDGPU的本地HBM3内存是H100PCIe的2.72倍,VRAM带宽是H100PCIe的2.66倍。
在内存测试中,AMDGPU唯一失利的地方是内存延迟结果,H100比AMDGPU快57%。
请注意,这是最低规格的H100PCIe显卡,拥有80GBHBM2E。后续版本(如H200)包含高达141GB的HBM3E,带宽最高可达4.8TB/s。
Raw吞吐量
ChipsandCheese的指令吞吐量结果考虑了INT32、FP32、FP16和INT8计算。
AMD芯片的指令吞吐量高得离谱。有时,MI300X比H100快5倍,最差时也快40%。
人工智能推理测试
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-06-28 08:45:06
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: