• 我的订阅
  • 科技

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

类别:科技 发布时间:2024-12-07 09:58:00 来源:雷峰网

1958年,德州仪器的杰克.基尔比(Jack Kilby)设计出了带有单个晶体管的硅芯片。1965年,仙童半导体已经掌握了如何制造一块拥有50个晶体管的硅片。正如仙童半导体的联合创始人戈登.摩尔(Gordon Moore)当年观察到的那样,一块硅片上可容纳的晶体管数量几乎每年翻一番。

2023年,苹果发布了iPhone 15 Pro,由A17仿生芯片驱动,这款芯片拥有190亿个晶体管。56年来,晶体管的密度增加了34倍。这种指数级的进步,被粗略地称为摩尔定律,一直是计算机革命的引擎之一。随着晶体管变得越来越小、越来越便宜以及速度越来越快,今天实现了手握“超级计算机”的奇迹。但人工智能时代需要处理的数据数量之多,已经将摩尔定律推向了极限。

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

几乎所有现代人工智能中的神经网络都需要经过训练,以确定正确的权重(权重用来衡量输入信号对于神经元的影响程度,即不同输入的重要性权重),从而为其数十亿,有时甚至数万亿的内部连接赋予正确的权重。这些权重以矩阵的形式存储,而训练模型则需要使用数学方法对这些矩阵进行操作。

单层神经网络的本质是矩阵相乘,两个按行和列排列的数字矩阵集合被用来生成第三个这样的集合,第三个集合中的每个数字都是通过将第一个集合中某一行的所有数字与第二个集合中某一列的所有数字相乘,然后相加而得到的。如果矩阵很大,有几千或几万行几万列,而且需要随着训练的进行反复相乘,那么单个数字相乘和相加的次数就会变得非常多,这就是人工智能的“思考方式”,通过对输入数据的处理得出答案。

芯片集群「贵」出天际,10年内单个集群价值将达万亿美元

然而,神经网络的训练并不是唯一一种需要高效处理矩阵乘法运算的技术。游戏产业高质量的视觉呈现同样需要这一技术,在25年前,这是一个巨大的市场。为了满足这一需求,英伟达率先设计了一种新型芯片,即图形处理器(GPU),在这种芯片上布置并连接晶体管,使其能够同时进行大量矩阵乘法运算。与大多数中央处理器(CPU)相比,GPU可以更大批量地处理数据,而且能耗更低。

2012年,训练AlexNet(开创 “深度学习 ”时代的模型)需要为6000万个内部连接分配权重。这需要4.7x10^17次浮点运算(flop,算力最基本的计量单位),每次浮点运算大致相当于两个数字的相加或相乘。此前,这么多的计算量是不可能完成的,但当时两个GPU就完成了AlexNet系统的训练。相比之下,如果使用当时最先进的CPU仍需要耗费大量的时间和算力。

乔治城大学安全与新兴技术中心最近发布的一份报告称,在用于训练模型时,GPU的成本效益比CPU高出10-100 倍,速度提升1000倍。正是因为有了GPU,深度学习才得以蓬勃发展。不过,大型语言模型(LLM)进一步推动了对计算的需求。

「Scaling Laws」打破「Moore's Law」

2018年,OpenAI的研究人员亚历克.拉德福德(Alec Radford)利用谷歌研究人员在“Attention Is All You Need”中提出的Transformers(采用注意力机制的深度学习模型),开发了一种生成式预训练变换器,简称GPT。他和同事们发现,通过增加训练数据或算力,可以提高大模型的生成能力,这个定律被称为“Scaling Laws”。

由于行业遵从Scaling Laws定律,大语言模型的训练规模越来越大。据研究机构Epoch ai估计,2022年训练GPT-4 需要2x10^25个 flop,是十年前训练AlexNet所用算力的4000万倍,花费约1亿美元。Gemini-Ultra是谷歌在2024年发布的大的模型,其成本是GPT-4的两倍,Epoch ai估计它可能需要5x10^25个flop。这些总数大得难以置信,堪比可观测宇宙中所有星系的恒星总数,或太平洋中的水滴合集。

过去,解决算力不足的办法就是耐心等待,因为摩尔定律还在生效,只需要等上一段时间,新一代的芯片就会集成更多更快的晶体管。但摩尔定律已经逐渐失效,因为现在单个晶体管的宽度只有几十纳米(十亿分之一米),要想实现性能的定期跃升已变得非常困难。芯片制造商仍在努力将晶体管做得更小,甚至将它们垂直堆叠起来,以便在芯片上挤出更多的晶体管。但是,性能稳步提升而功耗下降的时代已经过去。

随着摩尔定律放缓,想要建立更大的模型,答案不是生产更快的芯片,而是打造更大的芯片集群。OpenAI内部透露,GPT-4是在25000个英伟达的A100上训练的,这些GPU集群在一起,以减少在芯片间移动数据时造成的时间和能量损失。

Alphabet、亚马逊、Meta和微软计划在2024年投资2000亿美元用于人工智能相关的领域,比去年增长45%,其中大部分将用于打造大规模的芯片集群。据报道,微软和OpenAI正计划在威斯康星州建立一个价值1000亿美元的集群,名为 “星际之门”(Stargate)。硅谷的一些人则认为,十年内将出现一个价值1万亿美元的集群。这种超大规模基础设施建设需要消耗大量能源,今年3月,亚马逊在一座核电站隔壁购买了一个数据中心,该核电站可为其提供千兆瓦的电力。

对人工智能领域的投资并不全是在GPU及其功耗上,因为模型一旦训练完成,就必须投入使用。使用人工智能系统所需要消耗的算力,通常约为训练所需算力的平方根,这样的算力需求仍然很大。例如,GPT-3需要3x10^23flop的算力来训练,则推理需要3x10^11flop算力。FPGA和ASIC芯片是专为推理量身定制的,在运行人工智能模型方面,比使用GPU更高效。

不过,在这股热潮中表现最好的还是英伟达。英伟达的主导地位不仅来自其在GPU制造方面积累的技术和投入大量的资金(黄仁勋称,Blackwell的开发成本高达100亿美元)。此外,英伟达还拥有用于芯片编程的软件框架,即近乎已成为行业标准的CUDA。

竞争对手都在寻找英伟达的弱点。AI芯片独角兽企业SambaNova Systems的CEO Rodrigo Liang称,英伟达的芯片有几个缺点,这可以追溯到它们最初在游戏中的用途。其中一个特别大的问题是,在数据存取方面的能力有限(因为一个GPU无法容纳整个模型)。

另一家AI芯片初创公司Cerebras则推出了21.5厘米宽的“晶圆级”处理器。目前的大部分GPU包含大概成千上万个独立内核,可以进行并行计算过,而Cerebras开发的芯片包含近100万个。Cerebras声称,其另外一个优势是,它的能耗仅为英伟达最好芯片的一半。谷歌则推出了自己的张量处理单元(TPU),可用于训练和推理。其Gemini 1.5 ai模型一次摄取的数据量是GPT-4的八倍,部分原因就是采用了定制芯片。

尖端GPU的巨大价值与日俱增,使其成为地缘政治的筹码。虽然芯片产业是全球性的,但只有少数几个国家的技术控制着进入芯片产业高地的通道。英伟达的芯片在美国设计,世界上最先进的光刻机由荷兰公司ASML制造,而只有台积电和英特尔等尖端代工厂才能使用最顶级的光刻机。对于许多其他设备来说,地缘政治因素同样暗流涌动,日本是其中的另一个主要国家。

发展芯片和人工智能技术带来的政治博弈,使各国在这两个技术领域的投入不断增加,美国政府对向中国出口先进芯片实施严厉的管控,而中国正在投资数千亿美元来建立自己的芯片供应链。大多数分析人士认为,中国在这方面与美国仍存在较大的差距,但由于华为等公司的大笔投资,中国应对出口管制的能力比美国预期的要好得多。

美国也在加大投资力度,台积电在亚利桑那州投资约650亿美元建立晶圆厂,并获得约66亿美元的补贴。其他国家同样积极参与到这场竞争中,印度投入100亿美元、德国160亿美元以及日本260亿美元,未来,通过垄断人工智能芯片以阻碍其他国家人工智能产业技术发展的方式或许将会失效。

本文由雷峰网编译自:https://www.economist.com/schools-brief/2024/07/30/the-race-is-on-to-control-the-global-supply-chain-for-ai-chips

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-07 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

市场规模将达万亿级!自动驾驶产业发展进入“黄金十年”
近年来,受到政策和市场的赋能推动,自动驾驶产业加速落地,产业链基础配套和市场开发也越来越成熟。近阶段,智能网联乘用车“车内无人”商业化试点在京正式启动,上海浦东更是发放首批无驾驶
2023-07-12 18:14:00
专家:即使国产AI芯片单个算力不强 也能通过综合手段提升算力
...发表演讲,提出当前解决算力瓶颈问题需要综合考虑硬件集群算力、软件有效算力以及异构聚合算力三个维度。他强调,只要这三个维度的工作得到有效推进,即使国产AI芯片的单个算力相对较弱
2024-07-06 00:37:00
芯片设计5年内有望达万亿规模!今年注册量已同比增加20.6%
全球芯片产业正迎来技术突破与规模扩张的双重共振。国际赛道上,英伟达专为长上下文推理打造的Rubin芯片预计2026年下半年量产
2025-11-20 15:48:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
曾号称碾压英伟达!国产显卡公司:单个国产AI芯片不强但数量多,也能提升算力
...颈时表示,解决算力瓶颈问题需要从三个维度考虑:硬件集群算力、软件有效算力、异构聚合算力。他认为,做好这三个维度的工作,即使国产AI芯片单个算力不强,也能通过综合手段提升算力,
2024-07-10 15:12:00
要以计算集群的视角,来重新审视芯片!
...可以将多块国产芯片通过技术整合,形成一个强大的计算集群。例如,两三块华为海思、龙芯或飞腾的芯片,完全有可能达到甚至超越一块英特尔芯片的计算能力。而更进一步,这种方式还为我们提
2023-10-24 18:08:00
Enfabrica推出全球最快GPU网络接口控制器芯片,获1.15亿美元融资
...理能力已经显得微不足道,计算任务往往需要由大型显卡集群协同完成。然而,当前 GPU 内存容量和性能正在迅速增长,但输入/输出(I/O)性能的增长却相对滞后,这成了 AI 算力
2024-11-22 13:31:00
...实应用。北海道大学科学家成功开发出世界上第一个利用集群策略工作的微型机器人,首次证明分子机器人能够通过集群策略完成货物递送,运输效率是单个机器人的5倍。在计算机技术领域,丹麦
2023-01-05 01:46:00
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...问的云TPU。” 洛迈尔强调,谷歌云确保用户能够将其TPU集群扩展到以前无法达到的水平,让客户能够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型
2023-08-31 10:04:00
更多关于科技的资讯:
手握7000万订单,济南起步区这家企业以4倍新产能满弓劲发赶交付
鲁网2月26日讯在济南起步区崔寨街道的绿能智造产业园,济南鼎点数控设备有限公司正以干劲“满格”的姿态,火热推进复工复产
2026-02-26 17:11:00
近日,湖北省洪湖市烟草专卖局围绕信息采集工作推出四项关键措施,全面提升数据的规范性与准确度。强化队伍建设,提升专业能力
2026-02-26 17:12:00
艺龙酒店科技马年新春业绩斐然,品质服务与生态赋能共启新程
2026年春节,得益于“史上最长春节”红利持续释放,国内文旅酒店行业迎来显著增长。经文化和旅游部数据中心测算,春节假日9天
2026-02-26 17:13:00
湖北洪湖烟草:立足实效提升营销服务效能
为切实提升客户服务质量与经营获得感,近期,湖北省洪湖市烟草专卖局(营销部)紧密围绕市场实际与客户需求,采取针对性举措,全力推动营销服务效能再上新台阶
2026-02-26 17:14:00
2026年第37届国际宝饰展近日圆满落幕,在这场汇聚全球顶尖珠宝力量的盛会中,MiNG名皇珠宝以老钱风雅致展位惊艳亮相
2026-02-26 17:12:00
近期,湖北省洪湖市烟草专卖局立足零售客户实际需求,精准把握经营难点,创新实施“四式”服务模式,有效提升了客户的满意度和获得感
2026-02-26 17:13:00
中企加速AI服务出海 蚂蚁数科在马来西亚设立运营枢纽中心
随着全球企业级AI市场爆发,中国AI科技公司正加速在海外市场布局。2月26日,据海外媒体报道,蚂蚁数科旗下旗舰AI产品ZOLOZ在马来西亚正式启动运营枢纽中心
2026-02-26 15:06:00
从“拼价格”到“拼价值”,欧图中国引领中国商家稳拓欧洲
拥有76年历史的德国欧图集团(OTTO Group),是集国际化、多元化、创新性于一身的大型电子商务解决方案提供商及零售集团
2026-02-26 15:21:00
Sensor Tower 2025年最佳图像与视频编辑应用:美图秀秀
2月26日,全球移动应用数据平台Sensor Tower揭晓了APAC Awards 2025年度获奖名单,美图秀秀(Meitu)凭借在AI视觉领域的创新表现
2026-02-26 15:22:00
2026深圳家纺家居展3月启幕 构筑家居产业新高地
2026(春)深圳国际家纺布艺暨家居装饰展览会暨家居中国(深圳)创意设计周将于3月7日—10日在深圳福田会展中心盛大举办
2026-02-26 16:08:00
2026年春节假期,旅游消费市场持续升温,直播带货成为游客预订酒店的一个重要方式。有消费者在直播间下单度假村套餐后,发现宣传的“3分钟到海边”实为需要打车4公里才能到达
2026-02-26 16:33:00
鲁网2月26日讯为更好地服务老年群体,提升老年健康管理水平,日照市中医医院秉承“以医助养、医养结合”的发展理念,正式启动老年医学科门诊
2026-02-26 11:13:00
未来智能 viaim OpenNote 斩获iF设计奖 全球顶级设计奖项“大满贯”
近日,由AI硬件公司未来智能推出的viaim OpenNote斩获2026年德国iF设计奖。这是继德国红点奖与日本G-Mark优良设计奖之后
2026-02-26 11:16:00
复工复学出行潮,雅迪冠能白鲨II凭硬核实力成为年轻用户焕新首选
春节的余温还未散去,复工复产开学的“奋进模式”已经开启。为自己和家人挑选一台称心的座驾,成为许多用户踏上新年奋斗路、求学路的第一步
2026-02-26 11:16:00
杭州日报讯 还记得春晚《武BOT》节目中会后空翻的机器人吗?它不仅赚足了眼球,更在会场之外引爆了一个意想不到的蓝海市场——机器人租赁
2026-02-26 08:07:00