• 我的订阅
  • 科技

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

类别:科技 发布时间:2024-12-07 09:58:00 来源:雷峰网

1958年,德州仪器的杰克.基尔比(Jack Kilby)设计出了带有单个晶体管的硅芯片。1965年,仙童半导体已经掌握了如何制造一块拥有50个晶体管的硅片。正如仙童半导体的联合创始人戈登.摩尔(Gordon Moore)当年观察到的那样,一块硅片上可容纳的晶体管数量几乎每年翻一番。

2023年,苹果发布了iPhone 15 Pro,由A17仿生芯片驱动,这款芯片拥有190亿个晶体管。56年来,晶体管的密度增加了34倍。这种指数级的进步,被粗略地称为摩尔定律,一直是计算机革命的引擎之一。随着晶体管变得越来越小、越来越便宜以及速度越来越快,今天实现了手握“超级计算机”的奇迹。但人工智能时代需要处理的数据数量之多,已经将摩尔定律推向了极限。

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

几乎所有现代人工智能中的神经网络都需要经过训练,以确定正确的权重(权重用来衡量输入信号对于神经元的影响程度,即不同输入的重要性权重),从而为其数十亿,有时甚至数万亿的内部连接赋予正确的权重。这些权重以矩阵的形式存储,而训练模型则需要使用数学方法对这些矩阵进行操作。

单层神经网络的本质是矩阵相乘,两个按行和列排列的数字矩阵集合被用来生成第三个这样的集合,第三个集合中的每个数字都是通过将第一个集合中某一行的所有数字与第二个集合中某一列的所有数字相乘,然后相加而得到的。如果矩阵很大,有几千或几万行几万列,而且需要随着训练的进行反复相乘,那么单个数字相乘和相加的次数就会变得非常多,这就是人工智能的“思考方式”,通过对输入数据的处理得出答案。

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

然而,神经网络的训练并不是唯一一种需要高效处理矩阵乘法运算的技术。游戏产业高质量的视觉呈现同样需要这一技术,在25年前,这是一个巨大的市场。为了满足这一需求,英伟达率先设计了一种新型芯片,即图形处理器(GPU),在这种芯片上布置并连接晶体管,使其能够同时进行大量矩阵乘法运算。与大多数中央处理器(CPU)相比,GPU可以更大批量地处理数据,而且能耗更低。

2012年,训练AlexNet(开创 “深度学习 ”时代的模型)需要为6000万个内部连接分配权重。这需要4.7x10^17次浮点运算(flop,算力最基本的计量单位),每次浮点运算大致相当于两个数字的相加或相乘。此前,这么多的计算量是不可能完成的,但当时两个GPU就完成了AlexNet系统的训练。相比之下,如果使用当时最先进的CPU仍需要耗费大量的时间和算力。

乔治城大学安全与新兴技术中心最近发布的一份报告称,在用于训练模型时,GPU的成本效益比CPU高出10-100 倍,速度提升1000倍。正是因为有了GPU,深度学习才得以蓬勃发展。不过,大型语言模型(LLM)进一步推动了对计算的需求。

「Scaling Laws」打破「Moore's Law」

2018年,OpenAI的研究人员亚历克.拉德福德(Alec Radford)利用谷歌研究人员在“Attention Is All You Need”中提出的Transformers(采用注意力机制的深度学习模型),开发了一种生成式预训练变换器,简称GPT。他和同事们发现,通过增加训练数据或算力,可以提高大模型的生成能力,这个定律被称为“Scaling Laws”。

由于行业遵从Scaling Laws定律,大语言模型的训练规模越来越大。据研究机构Epoch ai估计,2022年训练GPT-4 需要2x10^25个 flop,是十年前训练AlexNet所用算力的4000万倍,花费约1亿美元。Gemini-Ultra是谷歌在2024年发布的大的模型,其成本是GPT-4的两倍,Epoch ai估计它可能需要5x10^25个flop。这些总数大得难以置信,堪比可观测宇宙中所有星系的恒星总数,或太平洋中的水滴合集。

过去,解决算力不足的办法就是耐心等待,因为摩尔定律还在生效,只需要等上一段时间,新一代的芯片就会集成更多更快的晶体管。但摩尔定律已经逐渐失效,因为现在单个晶体管的宽度只有几十纳米(十亿分之一米),要想实现性能的定期跃升已变得非常困难。芯片制造商仍在努力将晶体管做得更小,甚至将它们垂直堆叠起来,以便在芯片上挤出更多的晶体管。但是,性能稳步提升而功耗下降的时代已经过去。

随着摩尔定律放缓,想要建立更大的模型,答案不是生产更快的芯片,而是打造更大的芯片集群。OpenAI内部透露,GPT-4是在25000个英伟达的A100上训练的,这些GPU集群在一起,以减少在芯片间移动数据时造成的时间和能量损失。

Alphabet、亚马逊、Meta和微软计划在2024年投资2000亿美元用于人工智能相关的领域,比去年增长45%,其中大部分将用于打造大规模的芯片集群。据报道,微软和OpenAI正计划在威斯康星州建立一个价值1000亿美元的集群,名为 “星际之门”(Stargate)。硅谷的一些人则认为,十年内将出现一个价值1万亿美元的集群。这种超大规模基础设施建设需要消耗大量能源,今年3月,亚马逊在一座核电站隔壁购买了一个数据中心,该核电站可为其提供千兆瓦的电力。

对人工智能领域的投资并不全是在GPU及其功耗上,因为模型一旦训练完成,就必须投入使用。使用人工智能系统所需要消耗的算力,通常约为训练所需算力的平方根,这样的算力需求仍然很大。例如,GPT-3需要3x10^23flop的算力来训练,则推理需要3x10^11flop算力。FPGA和ASIC芯片是专为推理量身定制的,在运行人工智能模型方面,比使用GPU更高效。

不过,在这股热潮中表现最好的还是英伟达。英伟达的主导地位不仅来自其在GPU制造方面积累的技术和投入大量的资金(黄仁勋称,Blackwell的开发成本高达100亿美元)。此外,英伟达还拥有用于芯片编程的软件框架,即近乎已成为行业标准的CUDA。

竞争对手都在寻找英伟达的弱点。AI芯片独角兽企业SambaNova Systems的CEO Rodrigo Liang称,英伟达的芯片有几个缺点,这可以追溯到它们最初在游戏中的用途。其中一个特别大的问题是,在数据存取方面的能力有限(因为一个GPU无法容纳整个模型)。

另一家AI芯片初创公司Cerebras则推出了21.5厘米宽的“晶圆级”处理器。目前的大部分GPU包含大概成千上万个独立内核,可以进行并行计算过,而Cerebras开发的芯片包含近100万个。Cerebras声称,其另外一个优势是,它的能耗仅为英伟达最好芯片的一半。谷歌则推出了自己的张量处理单元(TPU),可用于训练和推理。其Gemini 1.5 ai模型一次摄取的数据量是GPT-4的八倍,部分原因就是采用了定制芯片。

尖端GPU的巨大价值与日俱增,使其成为地缘政治的筹码。虽然芯片产业是全球性的,但只有少数几个国家的技术控制着进入芯片产业高地的通道。英伟达的芯片在美国设计,世界上最先进的光刻机由荷兰公司ASML制造,而只有台积电和英特尔等尖端代工厂才能使用最顶级的光刻机。对于许多其他设备来说,地缘政治因素同样暗流涌动,日本是其中的另一个主要国家。

发展芯片和人工智能技术带来的政治博弈,使各国在这两个技术领域的投入不断增加,美国政府对向中国出口先进芯片实施严厉的管控,而中国正在投资数千亿美元来建立自己的芯片供应链。大多数分析人士认为,中国在这方面与美国仍存在较大的差距,但由于华为等公司的大笔投资,中国应对出口管制的能力比美国预期的要好得多。

美国也在加大投资力度,台积电在亚利桑那州投资约650亿美元建立晶圆厂,并获得约66亿美元的补贴。其他国家同样积极参与到这场竞争中,印度投入100亿美元、德国160亿美元以及日本260亿美元,未来,通过垄断人工智能芯片以阻碍其他国家人工智能产业技术发展的方式或许将会失效。

本文由雷峰网编译自:https://www.economist.com/schools-brief/2024/07/30/the-race-is-on-to-control-the-global-supply-chain-for-ai-chips

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-07 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

专家:即使国产AI芯片单个算力不强 也能通过综合手段提升算力
...发表演讲,提出当前解决算力瓶颈问题需要综合考虑硬件集群算力、软件有效算力以及异构聚合算力三个维度。他强调,只要这三个维度的工作得到有效推进,即使国产AI芯片的单个算力相对较弱
2024-07-06 00:37:00
市场规模将达万亿级!自动驾驶产业发展进入“黄金十年”
近年来,受到政策和市场的赋能推动,自动驾驶产业加速落地,产业链基础配套和市场开发也越来越成熟。近阶段,智能网联乘用车“车内无人”商业化试点在京正式启动,上海浦东更是发放首批无驾驶
2023-07-12 18:14:00
芯片设计5年内有望达万亿规模!今年注册量已同比增加20.6%
全球芯片产业正迎来技术突破与规模扩张的双重共振。国际赛道上,英伟达专为长上下文推理打造的Rubin芯片预计2026年下半年量产
2025-11-20 15:48:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
曾号称碾压英伟达!国产显卡公司:单个国产AI芯片不强但数量多,也能提升算力
...颈时表示,解决算力瓶颈问题需要从三个维度考虑:硬件集群算力、软件有效算力、异构聚合算力。他认为,做好这三个维度的工作,即使国产AI芯片单个算力不强,也能通过综合手段提升算力,
2024-07-10 15:12:00
要以计算集群的视角,来重新审视芯片!
...可以将多块国产芯片通过技术整合,形成一个强大的计算集群。例如,两三块华为海思、龙芯或飞腾的芯片,完全有可能达到甚至超越一块英特尔芯片的计算能力。而更进一步,这种方式还为我们提
2023-10-24 18:08:00
Enfabrica推出全球最快GPU网络接口控制器芯片,获1.15亿美元融资
...理能力已经显得微不足道,计算任务往往需要由大型显卡集群协同完成。然而,当前 GPU 内存容量和性能正在迅速增长,但输入/输出(I/O)性能的增长却相对滞后,这成了 AI 算力
2024-11-22 13:31:00
...实应用。北海道大学科学家成功开发出世界上第一个利用集群策略工作的微型机器人,首次证明分子机器人能够通过集群策略完成货物递送,运输效率是单个机器人的5倍。在计算机技术领域,丹麦
2023-01-05 01:46:00
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...问的云TPU。” 洛迈尔强调,谷歌云确保用户能够将其TPU集群扩展到以前无法达到的水平,让客户能够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型
2023-08-31 10:04:00
更多关于科技的资讯:
AI赋能千行百业一线故事(十九):从“人盯”到“数管”,产业大脑赋能传统制造
从“人盯”到“数管”,产业大脑赋能传统制造——AI赋能千行百业一线故事(十九)近日,在瑞源橡塑制品有限公司的车间内,技术人员正在调试新安装的智能化设备
2026-01-08 08:30:00
随着无人驾驶技术的不断发展,外形方方正正的功能性无人车进入我们的生活。目前,国家层面尚未对这种无人车设定统一资质要求,多个地方出台政策性文件允许无人车上路
2026-01-08 08:31:00
如何开通信用停车? 带您一图读懂
中山医院东侧嘉禾园地下停车场已纳入厦门信用停车管理平台。(市政空间公司 供图)厦门网讯(厦门日报记者 吴海奎)“开通免密支付以后
2026-01-08 08:33:00
浙江日报讯 (记者 赵静 共享联盟·温岭 王萍) 在仅约1厘米见方的玻璃基板上,比头发丝更细的金线被精准植入并焊接,形成一个能够高效处理信息数据的“微工作室”
2026-01-08 08:41:00
智造新丰景 | 雷沃智慧农业整体解决方案亮相“十四五”成就展
鲁网1月8日讯近日,由中国国家博物馆、工业和信息化部新闻宣传中心共同举办的“筑基强国路—中国制造‘十四五’成就展”在中国国家博物馆开幕
2026-01-08 09:31:00
WowNow 正式亮相 CES 2026|以 AI 驱动的端到端制造平台,让每一个想法被真正制造出来
在近日开幕的 CES 2026(国际消费电子展) 上,中国创新科技品牌 WowNow 正式亮相美国拉斯维加斯会展中心中央馆(LVCC Central Hall)21126 展位
2026-01-08 09:35:00
中国消费者报报道(杨文娴 记者张文章)福建省厦门市市场监管局自2025年初启动厦门市钨产业链供应链质量赋能行动,构建“链主主导
2026-01-08 09:50:00
中国消费者报北京讯(记者聂国春)1月7日至1月10日,2026年国际消费电子展(CES 2026)在美国拉斯维加斯会展中心举办
2026-01-08 09:50:00
中国消费者报福州讯(杨雅雯 记者张文章)1月7日,记者从福建省厦门市市场监管局获悉,厦门市产品质量监督检验院近日顺利通过CMA扩项评审
2026-01-08 09:50:00
国补新政落地 消费热潮涌动
随着2026年首批625亿元国补资金正式下达,线下市场销售火热。1月7日,记者在北京一家数码专卖店的宣传海报上看到,手机
2026-01-08 09:50:00
中国消费者报天津讯(记者万晓东)1月6日,天津市消费者协会发布《民用建筑用入户重型门支悬五金通用技术条件》团体标准,为装甲门
2026-01-08 09:50:00
杭州东站东、西广场地下六大停车场近日完成智慧化升级,上线“车位级导航”功能。这意味着,你不仅能一键导航到具体车位,停完车还能轻松找回爱车
2026-01-08 08:10:00
新一轮国补落地,浙江多家电器门店迎来“换新”客流
“有国补吗?”过去一年里,无论是在选购汽车还是添置家电时,许多消费者已经习惯带上这一问。2026年1月1日,新一轮“国补”正式开始
2026-01-08 08:10:00
1月7日,宜家中国宣布,2月2日起关闭中国七家商场,宜家宁波商场就在其中。这着实让人唏嘘,也把记者的思绪拉到了十三年前——2013年7月
2026-01-08 08:10:00
走进中北高新区企业太原晋西春雷铜业有限公司的生产车间,巨大电子屏上数据实时跳动,当前产量、工序良品率、设备状态、异常申报
2026-01-08 07:01:00