• 我的订阅
  • 科技

GPU受限,国内AI大模型能否交出自己的答卷?

类别:科技 发布时间:2023-04-14 18:02:00 来源:科技云报道

这个4月,成为国产大模型混战期。

GPU受限,国内AI大模型能否交出自己的答卷?

继百度之后,阿里、华为、京东、360等大模型也陆续浮出水面,大模型军备竞赛正式开启。

4月7日,阿里云宣布自研大模型“通义千问”开始邀请企业用户测试体验。

4月8日,华为云人工智能领域首席科学家田奇现身《人工智能大模型技术高峰论坛》,分享了华为云盘古大模型的进展及其应用。

同日,京东集团副总裁何晓冬表示,京东将在今年发布新一代产业大模型,言犀是“京东版”ChatGPT。

4月9日,360正式官宣,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。

但有业内人士指出,大模型的训练需要庞大的算力资源,GPU是大模型的最佳算力发动机。

截至目前,英伟达的GPU芯片正在为全球绝大多数的人工智能系统提供最基础的算力支持。

那么,在GPU受限的情况下,国内AI行业发展境况如何,能否交出属于他们自己的答卷?未来的发展是否会与国外越差越大?

01.国内厂商大囤AI芯片

众所周知,OpenAI ChatGPT大模型能有今日风光,英伟达的芯片A100功不可没。

公开数据显示,凭借10000片英伟达的GPU芯片,OpenAI成功训练出了GPT-3大语言模型。

TrendForce研究显示,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。

在这个ChatGPT的出圈元年,英伟达作为全球算力硬件当之无愧的龙头公司,今年前三个月市值翻了一番。

近日,英伟达又不负众望,推出了适用于ChatGPT的专用GPU,可以将推理速度提升10倍。

但值得注意的是,自2022年9月,美国禁止向国内客户售卖英伟达A100、H100和AMD的MI250人工智能芯片。

基于此,针对中国用户,英伟达按照A800操作模式(A100芯片的降维版本),推出了完全符合出口规定的H100的降维版本芯片,具体参数并未公布。

然而,无论是A800,还是H100中国版本,都和国外市场可使用的原版芯片存在差距。

据公开信息显示,英伟达专供中国的A800芯片,其传输速度只有A100的70%。

国内企业担心以后会买不到英伟达AI芯片,自美国制裁令开启,就开始大举囤芯片。

有厂家自去年下半年起就持续在市场中寻觅能拆出A100的各类整机产品,目的仅是获得GPU芯片。

但据媒体报道,国内拥有超高算力芯片的厂商并不多。国内云厂商主要采用的是英伟达的中低端性能产品,拥有超过1万枚GPU的企业不超过5家。

其中,拥有1万枚英伟达A100芯片的最多只有一家。

而国内云计算相关专家认为,做好AI大模型的算力最低门槛,就是1万枚英伟达A100芯片。

02.国内外AI芯片存在差距

从长远来看,未来大模型的研发和部署是必然趋势,而每个大模型训练和部署的背后,都有几万个GPU芯片在支持。因此,通用GPU市场需求将会迎来爆发式增长。

据Verified Market Research数据,2020年中国大陆的独立GPU市场规模为47.39亿美元,预计2027年将超过345.57亿美元。

有业内人士指出,作为大模型的主要入局者,国内互联网大厂拥有天然的数据优势,自然不希望因算力被卡在大模型能带来的广阔世界和商机之外。

在经历制裁后,国内的大型互联网企业在采购相关芯片时,尽管目前还是会购买英伟达,但也有相关的国产化替代方案。

因此,在这波替代潮中,国内的寒武纪、昆仑芯、燧原、华为海思、海光、沐曦、摩尔线程等中国新一代GPU芯片研发公司,都将迎来非常大的机会。

但同时,也需要看到国产GPU芯片与国外的差距,具体而言:

大模型对于算力的需求分为两个阶段,一是训练出ChatGPT这类大模型的过程;二是将这个模型商业化的推理过程。

在大模型训练阶段,需要处理高颗粒度的信息,对云端训练芯片的芯片处理信息的精细度和算力速度要求更高,而现阶段国产GPU大多还不具备支撑大模型训练所需的能力。

不同于多媒体和图形处理的单精度浮点计算(FP32)计算需求,在超算领域,双精度浮点计算能力FP64是进行高算力计算的硬性指标。

英伟达的A100同时具备上述两类能力,而国内GPU芯片的云端训练公司,大多只能处理单精度浮点计算,如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(云端推理思元270)的产品在FP32的理论指标上做得不错,但没有处理FP64的能力。

根据公开消息,目前国内唯一支持FP64双精度浮点运算的只有海光推出的DCU(协处理器),但是它的性能只有A100的60%左右。

但有专家认为,国内通用GPU产品在满足大模型训练上与国际旗舰产品存在差距,但并非不可弥补,只是此前行业在产品定义里未朝着大模型方向做设计。

目前国产GPU公司都在朝着大模型领域去做布局。

昆仑芯表示,昆仑芯2代芯片相较第一代产品大幅优化了算力、互联和高性能,公司正在不断研发新的产品和技术,为ChatGPT等大模型的应用提供更佳的性能体验。

登临科技新一代Goldwasser产品针对基于Transformer的网络和生成式AI类大模型的应用在性能有大幅提升,对标国际大厂的产品有明显的能效比和性价比的优势。

燧原科技宣布对公司品牌做战略升级,要打造AIGC时代的基础设施。

摩尔线程则表示将推出基于公司全功能GPU的AIGC算力平台。

此外,行业从业者也都在做相关的探索和努力,如思考能否通过Chiplet(将芯片堆叠或者并列摆放)、先进封装的方式提高算力。

03.国产AI芯片尚需生态支撑

事实上,比起硬件性能上的差异,软件适配与兼容让国内客户接受更难。

当大模型和应用层面的竞争拉响,从商业角度思考,采用国产AI芯片参战并不是好的选择。

从硬件性能上,使用国产AI芯片计算会比采用英伟达A100慢,在分秒必争的当下,“慢”是企业最不愿意看到的场景。

此外,哪怕能通过堆芯片的方式堆出一个算力相当的产品,从服务器运营的角度,它的主板开销、电费、运营费,以及需要考虑的功耗、散热等问题,都会大大增加数据中心的运营成本。

对厂商而言,把国产AI芯片用起来并不容易。

算力的释放需要复杂的软硬件配合,才能将芯片的理论算力变为有效算力。国产AI芯片想要替换英伟达的GPU,需要突破CUDA生态和整个产业生态的壁垒。

先说CUDA,为了把GPU的算力能力进一步发挥,英伟达花了10年时间,投入3000多人打造了一个CUDA框架。

这套框架里集成了很多调用GPU算力所需的代码,工程师可以直接使用这些代码,无须一一编写。

如果没有这套编码语言,软件工程师发挥硬件价值的难度会变得极大。

目前世界上主流的深度学习框架都基于CUDA进行加速,整个产业中下游软件、驱动厂家等都基于此进行适配。

这构成了一个极强大的生态壁垒,就像苹果系统内部的闭环生态,和window操作系统+上层应用软件一样。

尚处于创业阶段的芯片设计公司,很难在生态上投入如此大的人力财力,大多会选择兼容CUDA架构,来降低客户使用门槛。

当然,也有部分公司会选择自研加速器,如:寒武纪就构建了自己的加速平台;昆仑芯也面向开发者提供了类似英伟达CUDA的软件栈,希望打造自己的生态,也能摆脱硬件需受CUDA更新的困扰。

但即使有了这个编程框架,整个产业生态上的人也很难把这个芯片用起来。

对于企业来说,更换云端 AI 芯片要承担一定的迁移成本和风险,除非新产品存在性能优势,或者能在某个维度上提供其他人解决不了的问题,否则客户更换的意愿很低。

为此,国内从业者已经在构建生态上做努力。

在一个AI生态中,支撑大模型训练需求,需要底层硬件、中间深度学习平台、上层应用软件的整体适配、互相支持。

例如,2022年4月,百度飞浆已完成和包括百度昆仑芯、华为昇腾在内的22家国内外硬件厂商,31种芯片的适配和优化,基本覆盖国内主流芯片。

昆仑芯和飞浆完成3级兼容性适配,登临科技和飞浆也完成2级适配,沐曦集成电路和飞浆完成1级兼容性测试。

除此之外,华为的MindSpore和爱可生向量数据库兼容;智源研究院的九鼎智算平台也在和多家国内AI芯片公司合作。

04.结语

未来,大模型训练对算力的需求会越来越大。想要参战大模型竞赛,算法、算力、数据环环相扣。

在最卡脖子的芯片环节,如何缩小差距,成为国内厂商求共解的命题。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-16 21:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...响。百度过去主要使用英伟达的高性能GPU来对其自研的AI模型进行训练和执行推理任务。然而,美国在2022年10月首次出台针对AI芯片的出口限制政策,使得英伟达、AMD等厂商的
2024-03-08 09:25:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...PU卡,把服务器买走都行”。3月份开始,张阳明显感受大模型带来的冲击,作为一家云厂商算力平台负责人,他意识到市场甚至有些盲目。“当时客户比较慌,相当于对产品都没有什么要求,不
2023-06-29 12:00:00
围剿ChatGPT
人工智能(AI)聊天机器模型ChatGPT风潮狂飙超过百日,包括马斯克在内的商界大佬、科技巨头以及各国政府都已开始着手围剿GPT
2023-04-25 14:30:00
英伟达H20重回市场,但中国芯片过去三个月已爆单
...果。直接迎战英伟达的长板并非明智之举,相比之下,大模型推理的门槛并不算高,大部分厂商更愿意选择从推理着手,自下而上突破英伟达铁幕。 国内GPU厂商正抓着过去三个月真空期的机
2025-07-16 19:39:00
昨夜今晨:AMD发布大语言模型GPU正式挑战英伟达 欧盟与华为在多项前沿技术上开展合作
2023年6月15日 驱动中国昨夜今晨AMD推出大语言模型应用GPU产品 正式挑战英伟达AMD日前宣布即将推出最新款数据中心GPU——MI300X
2023-06-15 13:00:00
AI“百模大战” 英伟达稳坐钓鱼台
...平洋两岸的中美两国为核心,巨头们都在蜂拥进入 AI 大模型的战场,很多媒体称其为「百模大战」。还有不少科技公司高管也与其他创业者一样跳入 AI 创业的浪潮
2023-04-18 17:55:00
大模型热到芯片暴涨,阿里百度成了英伟达的打工仔
...,钛媒体经授权发布。中国科技公司和创业者竞相追逐大模型,引发GPU芯片需求量的暴增,以及价格的疯狂上涨。GPU是ChatGPT训练和部署的关键部件
2023-04-18 17:00:00
英伟达最强芯片之后,“卖铲子”生意更抢手了
...布推出采用Hopper架构的新一代加速计算平台,在这一轮大模型浪潮中“一卡难求”的H100,正是首款基于Hopper架构的GPU
2024-03-20 09:27:00
等不来的黄仁勋
...AI GPU,订单已满至年底。这其中,或许就有一批投身AI大模型的中国企业的订单。AI大模型同样是一个有着先发优势的领域,拥有巨大、优质数据集,强大的算力和算法,并率先落地的
2023-06-08 11:49:00
更多关于科技的资讯:
共创优质产品体验,从“MagicOS创享家”看荣耀的“听劝”哲学
摘要:以“听劝”的姿态持续进化,才是产品迭代的核心价值坐标。8月底,成都宽窄巷子又一次“出圈”了。年轻人能听Live现场
2025-09-08 08:19:00
网易云音乐教师节特别活动正式上线 百万黑胶VIP免费领
9月5日,网易云音乐教师节特别活动正式启动。本次活动为教师与学生群体都准备了丰厚福利,教师可免费领取100万份专属福利大礼包
2025-09-08 08:20:00
人工智能成“显眼包” 一批高科技产品亮相投洽会
MUGIN EV350全电动碳纤维垂直起降无人机平台,轻量化碳纤维机身设计,兼顾高强度与低能耗,适用于城市巡检、应急通信等场景
2025-09-08 09:01:00
“红房子”成热门国际会客厅 九位国际嘉宾昨做客
英中贸易协会会长詹诚信翻看《厦门日报》。厦门网讯(文/厦门日报全媒体记者 赵张昀 图/厦门日报全媒体记者 杨进福)投洽会的“国际范儿”体现在哪里
2025-09-08 09:01:00
IBM中国企业级AI巅峰论坛首落烟台黄渤海新区 携手盛启AI新世界
论坛现场大众网记者 邢晨 烟台报道9月5日,IBM中国企业级AI巅峰论坛在烟台黄渤海新区成功举办。论坛上,IBM分享了有关企业级AI的最新洞察
2025-09-08 09:10:00
鲁网9月8日讯当今世界,科技浪潮奔涌而来。数字化、智能化,正在改变每一个行业的运行逻辑,也重塑着金融业的未来。对银行来说
2025-09-08 10:42:00
电冰箱能效新国标出台 节能门槛再提升
本报记者 赵 曦 □ 唐 瑞近日,市场监管总局(国家标准委)发布新版GB 12021.2-2025《家用电冰箱耗电量限定值及能效等级》国家标准
2025-09-08 11:05:00
国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》9月1日起正式施行,明确要求AI生成的文字、图片、视频等内容须进行标识
2025-09-08 11:05:00
记者8月26日从市场监管总局获悉,市场监管总局(国家标准委)近日发布新版洗碗机能效水效强制性国家标准。此次修订发布的标准
2025-09-08 11:06:00
技术驱动增长!聊城乖宝研发构筑壁垒,自有品牌营收35亿稳居行业龙头
大众网记者 彭静 聊城报道9月5日,聊城市政府新闻办举行“产业链上的山东好品牌”企业家系列现场记者见面会(四)聊城农副产品加工与大健康产业链专场
2025-09-08 11:18:00
白象旗下网店公司因虚假广告被罚3万,此前因“多半”桶面“多半”为注册商标陷争议
企查查APP显示,近日,尚选电子商务(江苏)有限公司因发布虚假广告,被新沂市市场监督管理局罚款3万元。违法事实显示,该公司在某平台网店发布虚假宣传广告
2025-09-08 11:20:00
莘县新立信:破解鸡肉调理品同质化困局,打好差异化战略
大众网记者 彭静 聊城报道9月5日,聊城市政府新闻办举行“产业链上的山东好品牌”企业家系列现场记者见面会(四)聊城农副产品加工与大健康产业链专场
2025-09-08 11:22:00
腾讯游戏“触梦计划”,探索青少年公益新方式
2025年9月5日,久久公益节如期启动,腾讯游戏联合旗下游戏产品推出今年的公益向善活动,通过游戏化机制携手玩家将虚拟场景中的热爱转化为现实公益力量
2025-09-08 11:55:00
直击智博会|马上消费蒋宁:人机协同为企业带来决定性机遇
2025年9月5日下午,重庆悦来会议中心两江厅,1500余位产业精英共聚由马上消费主办的2025智博会·数字产业生态大会
2025-09-08 12:10:00
构筑全球数智生态 江苏移动与千余家苏企共谋出海新篇
9月4日下午,一场属于江苏出海企业的盛会在苏州举行。中国移动江苏公司(以下简称“江苏移动”)携手各方举办“苏企出海推进会”
2025-09-08 12:43:00