我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
12月7日消息,昨日AMD于美国加州圣何塞举行了名为“AdvancingAI”的主题活动,并正式发布了新一代面向AI/HPC的APU——InstinctMI300X/MI300A,前者是传统的GPU加速器,而后者则是CPU+GPU的融合加速器。
对于MI300X这款APU,AMD对比英伟达的H100加速卡,分享了MI300X的一些性能参数情况,具体数值如下:
内存容量是H100的2.4倍;
内存带宽是H100的1.6倍;
FP8TFLOPS精度是H100的1.3倍;
FP16TFLOPS精度是H100的1.3倍;
在1v1比较中,训练Llama270B模型速度比H100快20%;
在1v1比较中,训练FlashAttention2模型速度比H100快20%;
在8v8Server比较中,训练Llama270B模型速度比H100快40%;
在8v8Server比较中,训练Bloom176B模型速度比H100快60%;
另一款APU产品MI300A将Zen3CPU和CDNA3GPU整合在一起,并统一使用HBM3内存和第四代InfinityFabric高速总线互联,从而实现了结构简化和编程便利性。在统一架构的加持下,APU加速器能够更好发挥其性能潜力。
AMDInstinctMI300AAPU结合了Zen4、CDNA3和第4代Infinity架构和互联技术,其部分性能如下:
FP64精度下,最高算力61TFLOPS;
FP32精度下,最高算力122TFLOPS;
最高128GBHBM3内存;
1460亿个晶体管;
与此同时,AMD也发布了最新一代即将上市的笔记本新品所搭载的锐龙8040系列处理器,它继承了RyzenAINPU引擎,速度提升高达60%。而代号为StrixPoint的Ryen8050APU,将搭载XDNA2引擎,尤其所带来的AI性能提升也将超过3倍。
EPYC方面,本次大会并没有展示更多新技术,但第四代EPYC依旧是AI和HPC方面的全能手,也是目前最强大的通用处理器。
另外,不论是面对消费级领域还是数据中心等专业领域,AMD的EPYC处理器和Instinct加速器都是当今世界范围内不少运行速度领先的超级计算机首选解决方案。根据第62届全球超级计算机排行榜TOP500榜单显示,500套超算平台中,有140台来自AMD平台。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-12-08 12:45:46
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: