• 我的订阅
  • 科技

大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足

类别:科技 发布时间:2023-11-29 10:32:00 来源:IT时报
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足

自10月24日美国针对人工智能(AI)芯片的出口管制禁令正式生效,已经月余。

《IT时报》记者多方采访获悉,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2改良版本表示暂无相关回应。仍可以在国内销售的AMD MI 210则被认为在大模型微调阶段具有相当竞争力。

“最近算力涨价太多,我们确实感到很吃力。”一家大模型创业公司人士告诉《IT时报》记者,他们迫切希望有Plan B方案。

最好的Plan B当然是国产算力。目前能够与英伟达一战的华为昇腾910B已经在科大讯飞、多地智算中心落地商用,且从测试结果来看,某些性能已经与英伟达芯片相当。但突如其来的禁令,使得国内大模型厂商对华为芯片的需求直线上升。

春天来得太快,华为的供应链还需时间做好准备。

针对禁令,英伟达、英特尔、AMD等公司迅速做出反应,均放出消息正加紧研制改良版AI芯片。

英伟达计划推出最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle,其中HGX H20被认为是此次被禁售的H800替代品。一位英伟达经销商告诉《IT时报》记者,“HGX H20正在适配测试中,说是改良版,但其实是‘缩水版’。据我了解,H20符合美国出口芯片的相关规定,性能上比H800会有不小差异,但拿货最快也得下个月。”

大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足

据钛媒体App此前报道,H20在带宽、计算速度等方面均有所限制。理论上,整体算力要比英伟达H100(第一代被禁芯片)降低80%左右,即H20等于H100的20%综合算力性能,但增加了HBM显存和NVLink互联模块。

一份网传的调研报告认为,H20设计工艺较为一般,甚至不如华为昇腾910B的算力设计工艺,但增加的显存和网络带宽可能更适合训练参数不多的模型,适合多卡堆叠与多个AI服务器的使用,“如果有足够的买卡资源,并不考虑能耗,H20算力可以达到H100算力集群算力。”

但一位云计算业内人士认为,这种情况实现的可能性并不高,“H20是风冷,热设计功耗为400W,和A100大体相当,虽然低于H100的700W,但靠堆叠达到H100的算力,可能实际功耗是H100的2倍甚至更高。到最后比拼的都是能源,根本没有足够的电力供应机房。”

受限于禁令,这一个月来,算力市场风起云涌。

11月初,包括中贝通信、优刻得等提供AI算力技术服务的国内上市公司均公开表示,受服务器供应紧张影响,租赁价格将会结合市场行情等因素进行相应调整。

英伟达A100芯片算力服务收费价格甚至最高上调100%。

《IT时报》记者从某云商了解到,H800的算力资源非常紧俏,基本有价无货,A100(A800)的算力租赁价格上涨幅度暂时只有20%左右,但库存水位已经很低。

众多目光聚焦于国产本土AI芯片,而热度最高的自然是华为昇腾。此前《IT时报》曾独家报道,昇腾910B已在国内不少智算中心落地,进入规模化商用前期,且从多个信源反馈,在某些指标上,910B已经可以对标英伟达去年被禁的A100。

大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足

“我们之前已经和华为团队有深度合作,双方研发人员联手攻克了不少困难。”最近刚刚发布千亿参数大模型星辰的中电信人工智能科技公司副总经理刘翼告诉《IT时报》记者,测试中华为昇腾带来不少惊喜。

通信高级工程师、战略规划专家袁博此前在接受《华夏时报》采访时表示,华为昇腾芯片和英伟达GPU的适用场景不一样,在AI机器学习训练领域,其能力已经接近甚至部分超越英伟达的水平,但图像图形处理是弱势,因此只能弥补英伟达的部分场景。

“基于华为昇腾910B的算力价格大概和英伟达A100差不多,”一名接近华为的业内人士告诉《IT时报》记者,尽管H20仍有生态优势,但长远来看,国内各大厂商仍将华为昇腾看作Plan B的最优解,“只是910B产能正在慢慢爬坡,目前暂时无法满足这么多需求。”

长期来看,美国禁令的进一步收紧,给了国产算力更充足的发展时间。

IDC最新报告指出,随着政府支持,中国本土云端AI加速芯片制造商也正在快速增长。2023年上半年,中国AI服务器使用了50万块本地采购/开发的AI加速器芯片。这一数量占据了中国整个服务器市场的10%。显然,这个数字在2024年将飞速跃升。

至少在目前,国内各大厂商仍离不开英伟达。百度CEO李彦宏此前回应,百度得益于之前开发文心一言,已保存不少AI芯片,能够保证未来1~2年内不断更新AI大模型。腾讯高层也回应,H800等芯片库存水平较高,未来可支持几代混元大模型的更新。

《IT时报》记者分别致电腾讯、阿里、百度公司,询问AI芯片订单问题,但均未得到正面回应。

在大模型带来巨大算力消耗的红利之下,英伟达迎来了收入、利润暴增的三季度。11月22日,英伟达发布2024财年三季度财报,财报显示:英伟达三季度营收181.2亿美元,同比增长205.5%。营业利润104.2亿美元,同比增长1633.7%。营业利润率高达57.5%。

如此看来,算力芯片冲击仍有一段缓冲期,能够给到国内各大AI厂商一丝喘气和补救的时间。但另一方面,各类AI芯片正处于涨价通道,“僧多粥少”的局面仍在持续,尤其对于资金力度不够的中小AI企业来说,如今算力服务器和算力的价格并不友好。

“现在H800和A800服务器(不等同于算力租赁价格)的价格很高,一台已经飙升至350万和200万左右,比之前翻了一倍。”一名经销商表示。记者发现,不少经销商在各大社交平台发帖称手中有少量现货可以出售,并长期以市场行情价回收二手AI芯片。

“A800和H800价格比较乱,且不便宜。”一名江苏的芯片经销商告诉《IT时报》记者,随着美国禁令突然加强,国内二手算力芯片市场又开始活络,不少经销商开始面向全国收售英伟达二手A800和H800芯片。

另一位上海经销商告诉记者,他手上有少量现货的H800,报价超310万元,国产华为昇腾910B服务器的报价则为H800的一半,并称保证最快可于12月初交付现货,“越早订货可以越早交付。”

混战仍将持续一段时间。

排版/ 季嘉颖

图片/ 英伟达 IT时报

来源/《IT时报》公众号vittimes

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-29 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

突发!英伟达高性能AI芯片几被禁 国产算力的春天真来了
...国产算力替代的信心足了许多。短期的“平静”信心来自华为。今年8月举行的2023亚布力中国企业家论坛第十九届夏季高峰会上,科大讯飞创始人刘庆峰一言激起千层浪:华为的GPU能力已
2023-10-21 17:40:00
GPU受限,国内AI大模型能否交出自己的答卷?
这个4月,成为国产大模型混战期。继百度之后,阿里、华为、京东、360等大模型也陆续浮出水面,大模型军备竞赛正式开启。4月7日,阿里云宣布自研大模型“通义千问”开始邀请企业用户测试
2023-04-14 18:02:00
英伟达禁令之后,中国AI计算何去何从?
...。 加上AI芯片并不像手机芯片那样事关大众消费者,且华为已经在手机芯片上完成了突破。种种迹象合在一起,导致无论是大众还是行业,都对这次禁令产生了一种坦然,甚至有点见怪不怪的
2023-11-04 14:54:00
美国25万一张的显卡,禁止向中国供应!
...性能等于或超过A100的GPU产品也被限制出售。不知道百度华为阿里腾讯,这次囤够了显卡没?A100出口管制立即生效早在2022年8月26日
2023-03-09 17:45:00
逐浪大模型,国产GPU的机遇和挑战 | 钛媒体深度
...模型浪潮中的主要算力提供方时,国内诸如百度、阿里、华为这样的大模型参与者,将面临一个颇为棘手的境遇。按照美国商务部2022年关于高端GPU的出口限令,中国只能向英伟达购买算力
2023-06-21 16:00:00
科大讯飞回应美国AI芯片出口管制:华为昇腾910B能力基本可对标英伟达A100 【科大讯飞回应美国AI芯片出口管制:华为昇腾910B能力基本可对标英伟达A100】财联社10月20日电
2023-10-20 11:38:00
作者 | 袁斯来编辑 | 苏建勋大公司蜂拥入大语言模型,华为显得有些格格不入。7月7日,华为发布AI大模型盘古3.0版本。对于普通用户,这场发布会有些枯燥。政务大模型虽然有AI应
2023-07-10 12:56:00
...兴力量。当前,国产大模型训练算力大致分为三块,一是华为鲲鹏和昇腾AI生态的算力方案,没有英伟达GPU参与;二是混合型算力支持,大量采用英伟达A100芯片,部分环境增加AMD、
2023-10-20 18:12:00
英伟达最强芯片之后,“卖铲子”生意更抢手了
...达,但截至发稿未收到回应。国产GPU芯片发力2023年7月,华为公司董事、首席供应官应为民曾表示,国内AI芯片需求与年初相比,在半年时间里增长了10倍以上。强劲市场需求给国内
2024-03-20 09:27:00
更多关于科技的资讯: