• 我的订阅
  • 科技

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

类别:科技 发布时间:2024-08-06 09:27:00 来源:量子位

英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。

老黄的对策来了:阉割版芯片B200A曝光。

这难道就是“产能不够,刀法来凑”?

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

没错,根据SemiAnalysis分析,B200遇到的主要问题正是产能不足,更具体来说是台积电的新封装工艺CoWoS-L产能不足。

阉割版的B200A将先用于满足中低端AI系统的需求。

阉割版B200A,内存带宽缩水

为什么说B200A是阉割版?

指标上主要体现在内存带宽,4TB/s,比年初发布会上B200宣传的8TB/s直接缩水一半。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

这背后就是封装工艺由CoWoS-L退回CoWoS-S了,甚至B200A据称也兼容三星等其他非台积电的2.5D封装技术。

总的来说CoWoS先进封装目前有三个变体,CoWoS-S、CoWoS-R和CoWoS-L,主要区别在中介层(interposer)的方案。

中介层介于芯片晶圆和印刷电路板之间,实现芯片与封装基板之间的信息交换,同时提供机械支撑和散热能力。

CoWoS-S结构最简单,中介层就相当于一片硅板。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

CoWoS-R使用了RDL技术(Redistribution layer,再分布层),中介层是多层结构的薄金属材料。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

CoWoS-L最复杂,在RDL中介层中加入了一种LSI芯片(Local Silicon Interconnect,局部硅互联),可以实现更高布线密度,也可以做成更大尺寸。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

台积电推出CoWoS-L,是出于旧版技术在尺寸和性能继续增长上面临困难。

比如在AMD的AI加速芯片MI300上,CoWoS-S中介层已经扩大到了原标准的3.5倍,但仍难以满足未来AI芯片性能增长需求。

但现在,有消息称CoWoS-L在产能攀升中遇到一些问题,可能出现硅、中介层和基片之间的热膨胀系数不匹配,从而导致弯曲,需要重新设计。

过去台积电建立了大量的CoWoS-S产能,英伟达占据了最大份额。现在英伟达的需求可以迅速转向CoWoS-L,但台积电需要时间才能把产能转换到新工艺。

另外有消息称,B200A的核心(内部型号B102)将来也会用来造特别版B20,具体不展开了,懂得都懂。

B200训大模型,还面临其他挑战

Blackwell主推的规格是“新一代计算单元”GB200 NVL72,一个机柜就有36块CPU+72块GPU。

算力很到位,一个机柜在FP8精度的训练算力就高达720PFlops,直逼H100时代一个DGX SuperPod超级计算机集群(1000 PFlops)。

但耗电也很到位,据Semianalysis估算,功率密度约为每个机柜125kW,前所未有。在供电、散热、网络设计、并行、可靠性等方面带来挑战。

事实上,已经用于大模型训练的H100万卡集群,业界也还没有完全驯服好。

比如Llama 3.1系列的技术报告就指出,训练期间平均3小时故障一次,其中GPU导致的问题占了58.7%。

总计419次故障中,148 次是由各种GPU故障(包括NVLink故障)引起,72次可以具体到是由HBM3内存故障引起。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

所以总的来看,就算老黄最终发货了B200,AI巨头真正建好B200集群投入大模型训练,也还需要更多时间。

目前已经开始训练或接近完成的GPT-5、Claude 3.5 Opus、Llama 4等怕是用不上了,要到下下代模型才能见证Blackwell的威力。

One More Thing

针对B200推迟的传闻,英伟达给出了官方回应:

Hopper的需求强劲,Blackwell的样品试用已广泛开始,产量有望下半年增加。

具体会不会延迟三个月,不做具体答复。

不过摩根士丹利在最新报告中比较乐观,认为生产仅会暂停约两周。

参考链接:[1]https://x.com/dylan522p/status/1820200553512841239[2]https://www.semianalysis.com/p/nvidias-blackwell-reworked-shipment[3]https://3dfabric.tsmc.com/english/dedicatedFoundry/technology/cowos.htm[4]https://www.trendforce.com/news/2024/03/21/news-blackwell-enters-the-scene-a-closer-look-at-tsmcs-cowos-branch/[5]https://ieeexplore.ieee.org/document/9501649

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-06 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

天气这么热 RTX 4060你咋看着有点“凉”呢?
...望,自己的半条命都是拜空调所赐。但在如此炎热夏日,英伟达前几天刚刚正式解禁的RTX4060桌面显卡,看起来却有点凉
2023-07-07 23:06:00
5070都能媲美4090了 英伟达今天疯了吗
...以及 AI 个人终端 Project DIGITS ,依旧是一场 AI 含量极高的英伟达发布会。 更具体的,咱们接下来细聊
2025-01-08 00:48:00
英伟达帝国的一道裂缝
...运算训练的神经网络,一个星期的训练过程中仅用了四颗英伟达Geforce GTX 580。作为参考,谷歌猫用了1000万张图片
2023-05-18 11:06:00
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
在这个星球上,英伟达毫无疑问是如今的AI之王,其推出的H100已经被众多科技企业抢购,而英伟达的营收和利润也是节节攀升。但是在这个算力决定效率的今天,英伟达H100计算卡的算力还
2024-03-19 11:53:00
2025开年 黄仁勋扔出一串王炸
...意义上“闪亮全场”的鳄鱼皮夹克,似乎也暗示了今晚的英伟达将非比寻常。在短短数语回顾了英伟达在GPU行业的成绩后,RTX 50系列显卡当仁不让地打了头阵。简单概述就是,该系列产
2025-01-08 00:18:00
英伟达官宣Rubin GPU:3nm工艺,HBM4显存,新一代的AI之王
英伟达的Blackwell才刚刚发布,也为英伟达稳固了AI之王的宝座, 不过英伟达似乎觉得如今的Blackwell还不够给力,毕竟厂商所需要的算力远超想象,因此未来英伟达将改变产
2024-06-03 14:57:00
联发科计划明年进军PC市场:与英伟达合作,即将正式流片
...而现在有消息称这家企业将会在明年进军PC市场,目前与英伟达合作打造的芯片已经进入到了流片阶段。有消息称联发科正在联合英伟达研发一款面向PC市场的处理器,基于3nm制程架构打造
2024-10-10 14:03:00
英伟达GTC前瞻:最强AI芯片B100将问世,产品路线图有望公布
市场期待AI(人工智能)芯片龙头英伟达即将给出关于“史上最强AI芯片”B100的更多细节。万众瞩目的英伟达GPU技术大会(GTC)开幕在即。当地时间3月18日,黄仁勋将发表主题演
2024-03-18 21:14:00
黄仁勋:华为是英伟达在AI芯片领域“非常强大”的竞争对手
12月6日消息,英伟达首席执行官黄仁勋今日表示,在生产最好的人工智能芯片的竞争中,华为是英伟达“非常强大”(very formidable)的竞争对手之一。周三,黄仁勋在新加坡接
2023-12-06 14:12:00
更多关于科技的资讯: