• 我的订阅
  • 科技

发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?

类别:科技 发布时间:2024-10-15 17:56:00 来源:雷科技

前段时间,AMD在旧金山正式发布了一系列全新的产品,包括新一代的AI PC处理器、EPYC处理器、GPU加速卡等多款重磅产品。作为英伟达为数不多的友商,AMD对这一波新品寄予厚望,发布会还特意邀请了OpenAI、微软等巨头的大佬来站台,然而市场对其产品却不看好,其股价也应声下跌。难道AMD挑战英伟达的计划,还没开始就结束了?

AMD为何追不上英伟达?

AMD作为目前唯一一个有能力在GPU加速卡领域向英伟达发起挑战的厂商,其实很难说他们是失败者,毕竟除英伟达之外,其余厂商加起来也是不如AMD能打的。从AMD此次发布的一系列新品来看,其正在加快追赶英伟达的步伐,以最新的Instinct MI325X为例,其推理性能甚至比英伟达刚发货的H200还高20%以上。

不过强大的推理性能是靠远大于H200的显存所换来的,MI325X拥有多达256GB的HBM3E内存,这是目前全球性能最强的内存,连带着内存带宽也从5.3TB/s升级到6TB/s,成为AMD进一步拉升MI325X推理性能的一环。

发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?

图源:AMD

而在AI运算性能上,MI325X并没有比MI300X提高多少,FP16精度下算力为1.3PFlops,作为对比,英伟达H200的FP16算力为1.979PFlops,差距仍然十分明显,更何况英伟达还提供具有同样算力性能的H100。

虽然在算力上有着明显的差距,但是MI325X的功耗却并不低,根据AMD透露的消息,其单颗核心的功耗高达1000W,与英伟达H200基本持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。

更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难看出在芯片算力层面,英伟达与AMD的技术差距仍然非常明显。而且,英伟达在前段时间发布了H100的继任者B200,算力和推理能力都得到了显著的提升,其中FP16精度下的运算性能直接飙升到5PFlops,是H100的2.5倍,是MI325X的3.8倍。

发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?

图源:英伟达

3.8倍的算力差距已经不是价格或者功耗可以弥补的差距了,即使你可以通过部署4台MI325X服务器来获得媲美1台B200服务器的算力,但是也会面对更多的维护、调试和Debug麻烦。更何况,在多数情况下,计算中心的内部空间都是有限的,如何在有限的空间里塞入更多的算力,往往是企业考虑得更多的问题。

所以,AMD在过去的半年时间里,即使发布了更具性价比的MI300X,也依然无法撼动英伟达的地位,甚至不需要去讨论生态等问题,仅仅一个算力规模和效率差距就已经让AMD难以招架。

不过AMD的AI业务还是得到了不少的订单,原因主要是英伟达的产能无法满足所有需求,外溢的订单转而被AMD接受,此外如微软等企业,也在通过采购AMD GPU的方式来降低对英伟达的依赖。

只是情况如你所见,微软、OpenAI、谷歌等企业最新最大的AI算力集群,仍然都是将英伟达的H200列为首选。而AMD的MI300X等GPU,则主要被部署到其他数据中心,作为云端算力支持进行储备。

如果企业们仍然以AI算力为基准去配置数据中心,那么AMD想要战胜英伟达,只能祈祷奇迹发生,让他们打造出一款算力效率超过B200的芯片。不过,事情并非没有转机,随着AI大模型的训练规模达到一定高度,企业也逐渐将目光投向了应用层面,而这就是AMD的机会了。

在AI落地端发力,AMD能否换道超车?

不管是微软还是OpenAI,所有的AI厂商其实都在思考一个问题:AI服务推广,或者说:如何让AI服务被更多的人使用?

想要解决这个问题,首先需要搞定AI成本,以OpenAI为例,其在2024年预计将面临50亿美元的亏损,其中除了新建数据中心所需要投入的资金外,其余大多是维护和运营现有算力中心的成本,而ChatGPT高达19.99美元/月的高级订阅会员,已经让多数用户“摇头”,不少人都希望OpenAI可以降低资费,那么就能够获得更多的客户。

实话说,对于OpenAI而言,19.99美元的价格其实并不能确保其盈利,如果用户将其用于训练自己的大模型或是其他用途,那么实际上的算力成本会大大超出OpenAI向你收取的订阅费用,这也是为何前段时间他们突然开始加大力度封禁部分违规使用的账户,正是因为成本的激增正在进一步降低OpenAI的利润。

虽然很多时候我们都将GPU加速卡的AI算力看作是一个整体,但是在实际的应用中,用于预训练的算力性能与用于推理的算力性能,其实并不能直接等同。其中,推理性能主要决定的是在已加载的AI模型下,GPU能够提供的运算性能,在功耗固定的情况下,推理算力越强,GPU在执行AI任务时的成本就越低。

换言之,如果企业想降低AI服务的成本,让AI可以被应用到更广泛的领域,那么推理效率高的GPU就是必选项。那么AMD MI325X的定位就很明显了:为企业提供更低成本的AI算力,支撑AI应用落地。

实话说这个赛道英伟达不是没有注意到,今年才开始交付的H200就是为了解决推理成本发布的产品,其核心虽然仍是H100,但是却拥有141GB显存(H100为80GB),同时也对显存带宽进行了升级,进一步强化推理性能。

发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?

图源:英伟达

但是这还不够,随着AI应用的规模扩大,AI服务对算力的需求也在呈现爆发式的增长,而H200的供应却难以满足需求,这时候MI325X的优势就体现出来了,不仅拥有高达256GB的显存,而且价格比H200更低,供应也比H200充足。

所以,你可以看到微软、OpenAI等企业为AMD站台,不仅仅是为了降低英伟达对他们的掌控力,同样也是为了可以提前买到更多的MI325X,并将其作为普及AI服务的关键。

至少,在英伟达的B200批量出货前,MI325X都会是数据中心的优选,至于B200发布后如何应对,也就只能见招拆招了。毕竟从目前的情况来看,AMD不大可能在2025年前开发出性能接近B200的GPU,此前海外媒体推论,最快要到2026年,AMD才可能拥有接近B200性能的GPU,届时英伟达的B200乃至GB200(2*B200组成的单个GPU)都已经批量发货,AMD也将面临与今年年初类似的尴尬场景。

只能说AMD还是有机会的,即使无法撼动英伟达的领先地位,也可以抢下不少的市场份额。AI已经开始全面融入我们的生活,不管你承不承认,很多领域都已经与AI产生了联系,随着AI的进一步普及,也将更多地参与到民生经济中,为了维持AI社会的运转将需要庞大的算力,远非现在的数据中心可以满足的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-15 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达rtx3050a跑分曝光:性能稍强
9月6日消息,英伟达此前被曝将推一款RTX3050A移动端GPU,目前新品已经出现在跑分网站中,透露了一些性能信息。根据Geekbench跑分网站9月6日数据
2024-09-07 03:38:00
英伟达将推出rtx4050到4090系列gpu
1月3日消息,英伟达即将在今晚举行CES发布会,除了RTX4070Ti桌面显卡外,英伟达还将为游戏本平台推出RTX4050到4090系列GPU
2023-01-03 21:24:00
英伟达rtx4070ti参数公布:确认为rtx408012g
12月30日消息,英伟达官网现已更新RTX4070Ti的参数信息,基本确认这就是英伟达不久前砍掉的RTX408012G
2022-12-30 19:49:00
当地时间6月26日,英伟达召开年度股东大会。在会上,股东通过了高管新的薪酬计划,英伟达CEO黄仁勋于2024财年获得价值约3416
2024-06-28 00:20:00
AMD新一轮猛攻来袭!英伟达RTX 4060Ti或降价应对
...款显卡都将搭载基于RDNA3架构的Navi32GPU。与此同时,传出英伟达可能会采取一定的定价调整策略,以应对AMD新产品的挑战
2023-08-26 19:57:00
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度
2024-04-10 11:22:00
AMD新款显卡将至,英伟达或降低RTX 4060 Ti售价
...RDNA3架构的Navi32GPU。据知名油管博主Moore\'sLawisDead爆料,英伟达为应对即将到来的AMD新品
2023-08-25 23:05:00
对抗英伟达还得靠AMD 下周放大招:怪兽级显卡MI300来了
...9日消息,现在显卡市场上,不论是游戏卡还是加速卡,英伟达都是无比强势的存在,AMD的份额不断被压缩,但是能够对抗N卡的还是只有他们,好在下周的数据中心产品发布会,AMD会拿出
2023-06-09 10:00:00
英伟达DRIVE Ori 平台问世,造福无人驾驶领域!
...境,通常需要高性能的GPU或者使用专门的AI芯片。 三、英伟达DRIVE Ori SOC提供无人机领域解决方案:英伟达DRIVE Ori SoC集成了多核CPU和高性能GPU
2024-07-25 11:45:00
更多关于科技的资讯: