• 我的订阅
  • 科技

GPU受限,国内AI大模型能否交出自己的答卷?

类别:科技 发布时间:2023-04-14 18:02:00 来源:科技云报道

这个4月,成为国产大模型混战期。

GPU受限,国内AI大模型能否交出自己的答卷?

继百度之后,阿里、华为、京东、360等大模型也陆续浮出水面,大模型军备竞赛正式开启。

4月7日,阿里云宣布自研大模型“通义千问”开始邀请企业用户测试体验。

4月8日,华为云人工智能领域首席科学家田奇现身《人工智能大模型技术高峰论坛》,分享了华为云盘古大模型的进展及其应用。

同日,京东集团副总裁何晓冬表示,京东将在今年发布新一代产业大模型,言犀是“京东版”ChatGPT。

4月9日,360正式官宣,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。

但有业内人士指出,大模型的训练需要庞大的算力资源,GPU是大模型的最佳算力发动机。

截至目前,英伟达的GPU芯片正在为全球绝大多数的人工智能系统提供最基础的算力支持。

那么,在GPU受限的情况下,国内AI行业发展境况如何,能否交出属于他们自己的答卷?未来的发展是否会与国外越差越大?

01.国内厂商大囤AI芯片

众所周知,OpenAI ChatGPT大模型能有今日风光,英伟达的芯片A100功不可没。

公开数据显示,凭借10000片英伟达的GPU芯片,OpenAI成功训练出了GPT-3大语言模型。

TrendForce研究显示,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。

在这个ChatGPT的出圈元年,英伟达作为全球算力硬件当之无愧的龙头公司,今年前三个月市值翻了一番。

近日,英伟达又不负众望,推出了适用于ChatGPT的专用GPU,可以将推理速度提升10倍。

但值得注意的是,自2022年9月,美国禁止向国内客户售卖英伟达A100、H100和AMD的MI250人工智能芯片。

基于此,针对中国用户,英伟达按照A800操作模式(A100芯片的降维版本),推出了完全符合出口规定的H100的降维版本芯片,具体参数并未公布。

然而,无论是A800,还是H100中国版本,都和国外市场可使用的原版芯片存在差距。

据公开信息显示,英伟达专供中国的A800芯片,其传输速度只有A100的70%。

国内企业担心以后会买不到英伟达AI芯片,自美国制裁令开启,就开始大举囤芯片。

有厂家自去年下半年起就持续在市场中寻觅能拆出A100的各类整机产品,目的仅是获得GPU芯片。

但据媒体报道,国内拥有超高算力芯片的厂商并不多。国内云厂商主要采用的是英伟达的中低端性能产品,拥有超过1万枚GPU的企业不超过5家。

其中,拥有1万枚英伟达A100芯片的最多只有一家。

而国内云计算相关专家认为,做好AI大模型的算力最低门槛,就是1万枚英伟达A100芯片。

02.国内外AI芯片存在差距

从长远来看,未来大模型的研发和部署是必然趋势,而每个大模型训练和部署的背后,都有几万个GPU芯片在支持。因此,通用GPU市场需求将会迎来爆发式增长。

据Verified Market Research数据,2020年中国大陆的独立GPU市场规模为47.39亿美元,预计2027年将超过345.57亿美元。

有业内人士指出,作为大模型的主要入局者,国内互联网大厂拥有天然的数据优势,自然不希望因算力被卡在大模型能带来的广阔世界和商机之外。

在经历制裁后,国内的大型互联网企业在采购相关芯片时,尽管目前还是会购买英伟达,但也有相关的国产化替代方案。

因此,在这波替代潮中,国内的寒武纪、昆仑芯、燧原、华为海思、海光、沐曦、摩尔线程等中国新一代GPU芯片研发公司,都将迎来非常大的机会。

但同时,也需要看到国产GPU芯片与国外的差距,具体而言:

大模型对于算力的需求分为两个阶段,一是训练出ChatGPT这类大模型的过程;二是将这个模型商业化的推理过程。

在大模型训练阶段,需要处理高颗粒度的信息,对云端训练芯片的芯片处理信息的精细度和算力速度要求更高,而现阶段国产GPU大多还不具备支撑大模型训练所需的能力。

不同于多媒体和图形处理的单精度浮点计算(FP32)计算需求,在超算领域,双精度浮点计算能力FP64是进行高算力计算的硬性指标。

英伟达的A100同时具备上述两类能力,而国内GPU芯片的云端训练公司,大多只能处理单精度浮点计算,如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(云端推理思元270)的产品在FP32的理论指标上做得不错,但没有处理FP64的能力。

根据公开消息,目前国内唯一支持FP64双精度浮点运算的只有海光推出的DCU(协处理器),但是它的性能只有A100的60%左右。

但有专家认为,国内通用GPU产品在满足大模型训练上与国际旗舰产品存在差距,但并非不可弥补,只是此前行业在产品定义里未朝着大模型方向做设计。

目前国产GPU公司都在朝着大模型领域去做布局。

昆仑芯表示,昆仑芯2代芯片相较第一代产品大幅优化了算力、互联和高性能,公司正在不断研发新的产品和技术,为ChatGPT等大模型的应用提供更佳的性能体验。

登临科技新一代Goldwasser产品针对基于Transformer的网络和生成式AI类大模型的应用在性能有大幅提升,对标国际大厂的产品有明显的能效比和性价比的优势。

燧原科技宣布对公司品牌做战略升级,要打造AIGC时代的基础设施。

摩尔线程则表示将推出基于公司全功能GPU的AIGC算力平台。

此外,行业从业者也都在做相关的探索和努力,如思考能否通过Chiplet(将芯片堆叠或者并列摆放)、先进封装的方式提高算力。

03.国产AI芯片尚需生态支撑

事实上,比起硬件性能上的差异,软件适配与兼容让国内客户接受更难。

当大模型和应用层面的竞争拉响,从商业角度思考,采用国产AI芯片参战并不是好的选择。

从硬件性能上,使用国产AI芯片计算会比采用英伟达A100慢,在分秒必争的当下,“慢”是企业最不愿意看到的场景。

此外,哪怕能通过堆芯片的方式堆出一个算力相当的产品,从服务器运营的角度,它的主板开销、电费、运营费,以及需要考虑的功耗、散热等问题,都会大大增加数据中心的运营成本。

对厂商而言,把国产AI芯片用起来并不容易。

算力的释放需要复杂的软硬件配合,才能将芯片的理论算力变为有效算力。国产AI芯片想要替换英伟达的GPU,需要突破CUDA生态和整个产业生态的壁垒。

先说CUDA,为了把GPU的算力能力进一步发挥,英伟达花了10年时间,投入3000多人打造了一个CUDA框架。

这套框架里集成了很多调用GPU算力所需的代码,工程师可以直接使用这些代码,无须一一编写。

如果没有这套编码语言,软件工程师发挥硬件价值的难度会变得极大。

目前世界上主流的深度学习框架都基于CUDA进行加速,整个产业中下游软件、驱动厂家等都基于此进行适配。

这构成了一个极强大的生态壁垒,就像苹果系统内部的闭环生态,和window操作系统+上层应用软件一样。

尚处于创业阶段的芯片设计公司,很难在生态上投入如此大的人力财力,大多会选择兼容CUDA架构,来降低客户使用门槛。

当然,也有部分公司会选择自研加速器,如:寒武纪就构建了自己的加速平台;昆仑芯也面向开发者提供了类似英伟达CUDA的软件栈,希望打造自己的生态,也能摆脱硬件需受CUDA更新的困扰。

但即使有了这个编程框架,整个产业生态上的人也很难把这个芯片用起来。

对于企业来说,更换云端 AI 芯片要承担一定的迁移成本和风险,除非新产品存在性能优势,或者能在某个维度上提供其他人解决不了的问题,否则客户更换的意愿很低。

为此,国内从业者已经在构建生态上做努力。

在一个AI生态中,支撑大模型训练需求,需要底层硬件、中间深度学习平台、上层应用软件的整体适配、互相支持。

例如,2022年4月,百度飞浆已完成和包括百度昆仑芯、华为昇腾在内的22家国内外硬件厂商,31种芯片的适配和优化,基本覆盖国内主流芯片。

昆仑芯和飞浆完成3级兼容性适配,登临科技和飞浆也完成2级适配,沐曦集成电路和飞浆完成1级兼容性测试。

除此之外,华为的MindSpore和爱可生向量数据库兼容;智源研究院的九鼎智算平台也在和多家国内AI芯片公司合作。

04.结语

未来,大模型训练对算力的需求会越来越大。想要参战大模型竞赛,算法、算力、数据环环相扣。

在最卡脖子的芯片环节,如何缩小差距,成为国内厂商求共解的命题。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-16 21:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...响。百度过去主要使用英伟达的高性能GPU来对其自研的AI模型进行训练和执行推理任务。然而,美国在2022年10月首次出台针对AI芯片的出口限制政策,使得英伟达、AMD等厂商的
2024-03-08 09:25:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...PU卡,把服务器买走都行”。3月份开始,张阳明显感受大模型带来的冲击,作为一家云厂商算力平台负责人,他意识到市场甚至有些盲目。“当时客户比较慌,相当于对产品都没有什么要求,不
2023-06-29 12:00:00
围剿ChatGPT
人工智能(AI)聊天机器模型ChatGPT风潮狂飙超过百日,包括马斯克在内的商界大佬、科技巨头以及各国政府都已开始着手围剿GPT
2023-04-25 14:30:00
英伟达H20重回市场,但中国芯片过去三个月已爆单
...果。直接迎战英伟达的长板并非明智之举,相比之下,大模型推理的门槛并不算高,大部分厂商更愿意选择从推理着手,自下而上突破英伟达铁幕。 国内GPU厂商正抓着过去三个月真空期的机
2025-07-16 19:39:00
昨夜今晨:AMD发布大语言模型GPU正式挑战英伟达 欧盟与华为在多项前沿技术上开展合作
2023年6月15日 驱动中国昨夜今晨AMD推出大语言模型应用GPU产品 正式挑战英伟达AMD日前宣布即将推出最新款数据中心GPU——MI300X
2023-06-15 13:00:00
AI“百模大战” 英伟达稳坐钓鱼台
...平洋两岸的中美两国为核心,巨头们都在蜂拥进入 AI 大模型的战场,很多媒体称其为「百模大战」。还有不少科技公司高管也与其他创业者一样跳入 AI 创业的浪潮
2023-04-18 17:55:00
大模型热到芯片暴涨,阿里百度成了英伟达的打工仔
...,钛媒体经授权发布。中国科技公司和创业者竞相追逐大模型,引发GPU芯片需求量的暴增,以及价格的疯狂上涨。GPU是ChatGPT训练和部署的关键部件
2023-04-18 17:00:00
英伟达最强芯片之后,“卖铲子”生意更抢手了
...布推出采用Hopper架构的新一代加速计算平台,在这一轮大模型浪潮中“一卡难求”的H100,正是首款基于Hopper架构的GPU
2024-03-20 09:27:00
等不来的黄仁勋
...AI GPU,订单已满至年底。这其中,或许就有一批投身AI大模型的中国企业的订单。AI大模型同样是一个有着先发优势的领域,拥有巨大、优质数据集,强大的算力和算法,并率先落地的
2023-06-08 11:49:00
更多关于科技的资讯:
展现数字化发展硬实力 济南能源集团亮相2025国际数字能源展
大众网记者 赵港宁 济南报道9月18日,以“深AI能源 数创未来”为主题的2025国际数字能源展在深圳举行。济南能源集团所属神思电子
2025-09-20 11:22:00
量子位「MEET2026智能未来大会」启动!
我们正迈入一个由人工智能重塑一切的新时代。智能技术已经深刻渗透进生产和生活,跨越了软件、硬件、机器人等不同形态,从工具发展为能深度理解人类需求的智能伙伴
2025-09-20 05:23:00
纵览·9张|空间魔术师
壹 随着网购的便利化和生活节奏的加快,许多人在购物的同时,却忽视了归纳和“断舍离”。于是整理收纳师进入了大家视野,成为走俏的新职业
2025-09-20 08:02:00
iPhone17系列正式发售,多地门店排起长队,有黄牛加价500元收购Max 256G版本
北京时间9月19日,iPhone 17系列正式发售,线上抢购到首批货源的用户将陆续收到新机,官方零售店也于8:00提前开门营业供预约取货用户取货
2025-09-19 12:06:00
在杭州看见创新未来 第四届数贸会全景前瞻
第四届全球数字贸易博览会(以下简称“数贸会”)将于2025年9月25日至29日在杭州大会展中心举行。作为我国唯一以数字贸易为主题的国家级
2025-09-19 14:13:00
走向国际,INGS英树三度荣获IFSCC青睐
2025年9月15日至18日,第35届IFSCC国际化妆品科学大会以“THE FUTURE IS SCIENCE”为主题于法国戛纳盛大启幕
2025-09-19 14:16:00
国网高密市供电公司:物资仓库里的“绣花功夫”
大众网记者 宋学敏 通讯员 赵雯雯 贾聚光 潍坊报道9月19日,走进国网高密市供电公司物资供应分中心的物资仓库,整齐的货架
2025-09-19 14:23:00
研发投入年增超40%!Coosea酷赛智能凭什么敢在创新上“下血本”?
在智能制造与AI设备行业加速迭代的浪潮中,研发实力已成企业核心竞争力的关键。近日,Coosea酷赛智能披露的研发投入数据引发行业关注——其研发投入年增超40%
2025-09-19 14:51:00
喜茶「超级植物茶」上新一周年,差异化引领新茶饮产品趋势
9月19日,喜茶「超级植物茶」迎来上新一周年。据官方数据显示,「超级植物茶」全系列产品已售出超1亿杯,喜茶坚持采用新鲜的羽衣甘蓝每日现榨
2025-09-19 15:01:00
京东运动户外品类日开启 运动、健身、户外出游全场景好物立减12%
秋高气爽迎国庆,正是走出家门、拥抱自然的好时机。9月19日晚8点至20日,京东运动户外品类日正式开启,携手阿迪达斯、北面
2025-09-19 15:08:00
华为云杨友桂:数智化转型从来不是 \
9月19日,在华为全联接大会2025上,华为高级副总裁、华为云全球Marketing与销售服务总裁杨友桂介绍了华为云如何通过四大关键竞争力
2025-09-19 15:24:00
焕新家庭储鲜,澳柯玛多款行业领先冷柜亮相电博会
鲁网9月19日讯2025年9月19日至21日,中国国际消费电子博览会在青岛国际会展中心盛大举行。作为温度科技专家的澳柯玛
2025-09-19 15:25:00
当下,金融科技行业正站在新一轮周期的关键拐点。当金融科技领域历经市场的深度重塑,行业周期拐点下,平台该如何突围?辽宁自贸试验区(营口片区)桔子数字科技有限公司(简称“桔子数科”)以科技赋能为锚点
2025-09-19 15:28:00
“媒体+科技”构建融媒服务新生态 长城新媒体集团与腾讯签订战略合作协议
金秋时节,硕果盈枝。2025年9月16日,长城新媒体集团有限公司与深圳市腾讯计算机系统有限公司在2025全球数字生态大会期间签订战略合作协议
2025-09-19 15:34:00
做教育行业的“清流”,高途以人文和体育探索营销新范式
进入2025年,教育行业在调整期后逐步迎来品牌动作的复苏潮。在行业变革的深水区,品牌营销往往是透视品牌预期和行业趋势的风向标
2025-09-19 15:34:00