• 我的订阅
  • 科技

英伟达GB200 NVL72面临过热问题,或将更改设计及延迟发货

类别:科技 发布时间:2024-11-19 09:43:00 来源:芯智讯
英伟达GB200 NVL72面临过热问题,或将更改设计及延迟发货

11月18日消息,据 The Information 报道,英伟达(Nvidia)最新一代的 Blackwell GPU在安装在大容量服务器机架中时,正面临过热的重大挑战,这些问题甚至导致了设计更改和发货延迟,并引起了 Google、Meta 和 Microsoft 等头部客户对他们能否按时部署基于 Blackwell GPU的AI服务器的担忧。

据与 The Information 交谈的知情人士称,英伟达用于 AI 和 HPC 的 Blackwell GPU 在内部配备 72 个处理器的服务器——DGX GB200 NVL72中使用时会过热。预计这些机器每个机架的功耗高达 120kW。这些问题导致英伟达多次重新评估其服务器机架的设计,因为过热会限制 GPU 性能并有可能损坏组件。客户也担心这些挫折可能会阻碍他们在数据中心部署新处理器的时间表。

报道称,英伟达已指示其供应商对机架进行多项设计更改,以抵消过热问题。英伟达正与其供应商和合作伙伴密切合作,开发工程修订版以改善服务器冷却。虽然这些调整是此类大规模技术发布的标准,但它们仍然增加了延迟,进一步推迟了预期的发货日期。

为了应对延迟和过热问题,英伟达发言人强调,其与云服务提供商的合作努力,并将设计更改描述为正常开发过程的一部分。与云服务提供商和供应商的合作伙伴关系旨在确保最终产品满足性能和可靠性预期,因为英伟达将继续致力于解决这些技术挑战。

值得一提的是,此前由于Blackwell GPU的设计缺陷,导致了其量产的推迟。这主要是由于英伟达的 Blackwell B100 和 B200 GPU 使用台积电的 CoWoS-L 封装技术来连接他们的两个小芯片。该设计包括一个带有本地硅互连 (LSI) 桥接器的 RDL 中介层,支持高达 10 TB/s 的数据传输速度。这些 LSI 电桥的精确定位对于该技术按预期运行至关重要。然而,GPU 小芯片、LSI 桥接器、RDL 中介层和主板基板的热膨胀特性不匹配,导致翘曲和系统故障。据报道,为了解决这个问题,英伟达修改了 GPU 芯片的顶部金属层和凸块结构,以提高生产可靠性。尽管 英伟达从未透露有关这些更改的具体细节,但它指出,作为修复的一部分,新的光罩是必要的。

因此,Blackwell GPU 的最终版本仅在 10 月下旬才进入量产,这意味着英伟达将能够从 1 月下旬开始发货这些处理器。

英伟达的客户,包括 Google、Meta 和 Microsoft 等科技巨头,都使用英伟达的 GPU 来训练他们最强大的大型语言模型。Blackwell GPU 的延迟自然会影响英伟达客户的计划和产品。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-19 11:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达最强AI芯片曝重大设计缺陷,中国特供版意外曝光!
【新智元导读】因设计缺陷,英伟达最强AI芯片Blackwell,真的要延期发货了。金主爸爸们哀声一片,所有预定计划预计要拖延至少三个月
2024-08-06 09:29:00
瑞穗力荐英伟达:Q2财报将成重大催化剂,还能再涨26%
尽管英伟达股价在过去一个月内下跌了近18%,但根据瑞穗证券(Mizuho)的说法,该股仍有很大的上涨空间,其即将发布的业绩报告将成为人工智能(AI)股票的主要催化剂。该行在最新发
2024-08-12 10:08:00
英伟达展示blackwell平台,否认推迟上市
8月24日消息,英伟达邀请部分媒体举办吹风会,向科技记者首次展示了Blackwell平台。英伟达将出席8月25-27日举办的HotChips2024活动
2024-08-25 06:58:00
继良品率低后,英伟达Blackwell又过热,说好的明年初发货呢?
...迭代」称为「正常且在意料之中」。今年的的 GTC 大会,英伟达将 AI 芯片的标杆推向了难以想象的高度。为了帮助世界构建更大
2024-11-19 09:49:00
全球最大AI超算内部首次曝光!马斯克19天神速组装10万块H100,未来规模还将扩大一倍
...网络系统的创新设计。这台全球最大AI超算Colossus由xAI和英伟达联手建造,耗资数十亿,10万块H100仅半个多月搭建完成
2024-11-01 09:29:00
利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪
作者|范亮 丁卯 诺明编辑|丁卯 郑怀舟图:英伟达供应链公司概览 数据来源:公司公告、36氪整理5月22日,全球资本市场的“大网红”英伟达发布了2025财年第一财季(截至2024
2024-05-24 17:15:00
超威电脑:已部署超过10万个基于液冷方案的GPU
...了“最高的每机架GPU密度”,即每个机架最多可安装96个英伟达(NVIDIA)B200芯片。据介绍,超威电脑“完整的液体冷却解决方案”
2024-10-09 09:50:00
英伟达财报亮眼,市值大跌千亿美元
面对市场的超高期待,英伟达终于“哑火”了。在今天财报发布之前,英伟达已经连续6个季度给出了超出市场预期的业绩。2024年以来,英伟达股价已经上涨超过了160%,市值增长超过1.8
2024-08-29 17:50:00
黄仁勋打消“Blackwell疑虑”:已交付13000个 未来只会供不应求!
最新财报显示,“AI宠儿”英伟达Q3营收几乎同比翻了一番。投资者和分析师都想知道,这种增长势头还能持续多久?不难看出,未来的希望都落在了英伟达新一代AI芯片Blackwell系列
2024-11-21 17:56:00
更多关于科技的资讯: