• 我的订阅
  • 财经

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

类别:财经 发布时间:2024-03-02 13:38:00 来源:钛媒体APP
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

昨天凌晨,英伟达发布了2024财年第四季度财报,业绩再次超出预期。但比起亮眼的业绩,更让人印象深刻的是,英伟达在财报电话会议的一个观点:

推理端的爆发,可能很多人还是低估了。

据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,老黄总共提到了16次“推理”这个词提了,而“训练”只有8次。这也侧面证明了英伟达对推理端的重视。

据路透社与彭博2024年2月初报道,英伟达正在建立一个专注于为云计算、AI等领域设计ASIC专用芯片的新业务部门。之所以英伟达要布局ASIC,正是因为其看到了即将爆发的推理市场,不想出让这块即将到来的大蛋糕。在他们看来,凭借在能耗和性能方面的优势,ASIC在AI落地过程中拥有极大的潜力。

而随着推理端的爆发,AI芯片领域的格局或也将随之变化。

01 推理端走到爆发元年

除了英伟达这份财报,财报后电话会议里信息也不小。其中,“推理”是最重要的关键词。

在这里,先对推理做了一个简单的科普。现在AI的算力需求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。

对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每 token 的算力需求是常数,在训练阶段一般为 6 FLOPs,推理阶段则为 2 FLOPs。

由于当下大模型企业把更多的精力都花在提升大模型智能水平,因此绝大部分算力都被用在于训练阶段。但随着模型迭代逐渐走向停滞,加上越来越多AI应用的落地,推理侧的需要也在快速增加。

但即使如此,在英伟达最新的电话会议里,老黄仍然认为,推理需求在当下被极大低估,他给出的解释是:

“互联网有数万亿的信息容在3英寸见方的手机里,将所有这些信息整合到如此小的空间中,这是通过一个系统,一个称为推荐系统的令人惊叹的系统。

过去,些推荐系统都是基于CPU方法的,但最近向深度学习和生成式人工智能的迁移确实让这些推荐系统现在直接进入了GPU加速的道路,嵌入需要GPU加速、最近邻搜索需要GPU 加速、重新排序需要GPU加速,它需要GPU加速来为您生成增强信息,所以现在推荐系统的每一个步骤都用到了GPU。

如您所知,推荐系统是地球上最大的软件引擎,世界上几乎每一家大公司都必须运行这些大型推荐系统,每当您使用ChatGPT时,都会对其进行推断,每当你听说Midjourney以及他们为消费者生成的东西的数量时,当你看到Getty、我们与Getty和Adobe的Firefly所做的工作时,这些都是生成模型,这样的例子还在继续。正如我刚才提到的,这些都不是一年前存在的、100%全新的驱动力。“

类似的观点,月之暗面创始人杨植麟也曾表达过:26 年的时候也许模型用于推理的计算量会远远大于训练本身,可能花 10 倍的成本去推理,推理完之后花一倍的成本来训练,到时候推理就是训练。

老黄的意思很明确,总结起来一句话,2024年将成为推理端爆发元年。

02 押注ASIC

为了更好抓住推理端需求的爆发,英伟达正在做很多准备。据路透社与彭博2024年2月初报道,英伟达正在建立一个专注于为云计算、AI等领域设计ASIC专用芯片的新业务部门。

在解释英伟达为什么要做ASIC芯片前,我们先对AI芯片有一个简单的了解。目前,AI芯片主要分为CPU、GPU,这两个都很熟悉,还有FPGA(现场可编程门阵列,可以理解为半定制芯片),以及ASIC(定制芯片)。

根据GMInsight的统计,2022年全球AI芯片市场规模超过150亿美元,预计将在2032年超过4000亿美元,年复合增长率高达35%。而在去年出货量最大的依然是GPU,占比高达47%左右,第二名为占比34%的CPU,其次才是ASIC与FPGA,但ASIC已经隐隐有迎头赶超之势。

这里我们主要对比GPU与ASIC的差异。从特点上说,GPU更像是一大群工厂流水线上的工人,适合做大量的简单运算,很复杂的搞不了,但是简单的事情做得非常快。

与GPU不同,ASIC拥有性能高、体积小、功率低等特点,在特定领域定制后的效果远超CPU、GPU。比如,此前ASIC芯片就常被用于挖比特币。

由于ASIC芯片的设计和制造需要大量资金、较长的时间周期和工程周期,且一旦定制无法再次进行写操作,所以在模型快速迭代期,ASIC不是最优解。而随着模型迭代速度越来越慢,尤其到了应用阶段,ASIC针对特定需求开发,可根据需求对性能和功耗进行定向优化,其专用的芯片架构与高复杂度的算法相匹配,量产后在性能、功耗、成本方面均具有较大优势。

根据CSET报告《AI Chips: What They Are and Why They Matter》,相比CPU,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍。推理方面尤其好于GPU,见红框部分对比。

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

根据国海证券研报《GPT 5后NLP大模型逐步走向收敛,ASIC将大有可为》给出的数据,2025年ASIC在推理/训练应用占比分别达到40%、50%;在边缘侧,2025年ASIC在推理/训练应用占比分别达到70%、70%。

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

而这也解释了英伟达为什么想要布局ASIC的原因:维持自身的产业优势,不想出让这块即将到来的大蛋糕。

03 英伟达的机会和挑战

从训练需求驱动到推理需求驱动,不仅是行业增长动力的变化,更可能是行业的一次重新洗牌。

在GPU领域,英伟达拥有绝对的统治力:根据 Liftr Insights 数据,2022 年数据中心 AI 加速市场中,英伟达份额达 82%。根据不久前的数据,2023年人工智能研究论文中使用的英伟达芯片比所有替代芯片的总和多19倍。

毫无疑问,英伟达是去年以来AI浪潮的最大赢家。2022年10月到现在,英伟达的股价从110美元左右上涨到近600美元,涨了500%。FactSet数据显示,此前20个季度,英伟达有19个季度的业绩都优于市场预期。

但ASIC的崛起,可能给英伟达带来些许变数。相比在GPU领域的一家独大,ASIC领域就显得热闹许多。

近年来,头部厂商纷纷开始切入ASIC领域,包括谷歌、英特尔、IBM在内等科技公司都有所动作。比如,2019年英特尔就收购了Habana Lab,并在2022年推出Gaudi2 ASIC芯片。

其中,谷歌在ASIC领域优势最明显。2021年推谷歌出TPU v4, 运算效能大幅提升,去年该芯片已经迭代到了v5,相比V4,训练速度和推理时间分别提高两倍和 2.5 倍。与英伟达顶级显卡A100相比,TPUv5p更是占据明显优势。根据谷歌官方数据显示,TPUv5p在训练任务上比A100快四倍以上。

尽管竞争者众,但英伟达也并非毫无优势。尤其在系统能力(软件通信算法等)上,其仍然具有明显优势。比如,目前基于自回归模型的推理是访存密集型算力,尤其是只要高并发型的应用服务,且单卡存算比例又不够的情况下,对片间互联能力的要求再次提高,NvLink的优势就再次凸显了。

据路透社同篇报道,目前英伟达已与亚马逊、Meta、微软、谷歌和OpenAI等科技巨头商讨设计ASIC芯片的合作事项,探讨创建定制芯片的机会。

尽管英伟达是否能在ASIC领域延续优势仍未可知。但有一点可以确定,随着推理需求的增加,英伟达在AI芯片领域的绝对优势将大概率被撕开一个口子,一家独家的局面将被打破。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-02 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AMD CEO苏姿丰:我们和英伟达观点不同 AI领域不存在“一刀切”
...是,近日,英伟达刚刚公布了其第四财季财报,在分析师电话会议上,英伟达认为DeepSeek的出世,让业界产生了AI人工智能可以不用太高端的硬件也能这么厉害,但现在看来这个情况并
2025-02-27 16:06:00
马斯克梦想AI超算霸权,旗下公司却\
...年数十亿美元的投入。”今年1月的特斯拉第四季度财报电话会议上,一位分析师询问了关于Dojo最新进展及特斯拉是否有“足够的英伟达GPU供应来训练该系统”的问题。马斯克回应表示,
2024-03-22 16:44:00
英伟达今年还能再涨60%?美银上调目标价:仍处主导地位
...率提升只会加快人工智能被采用和发展的速度。他在业绩电话会议上说,“DeepSeek R1 点燃了全球的热情。这是一项出色的创新,但更重要的是,它开源了一个世界级的推理AI模型
2025-03-03 11:04:00
英伟达:Deepseek,戳破了老黄的“皮衣”?
英伟达 (NVDA.O)北京时间2月27日凌晨,美股盘后发布 2025财年第四季度财报(截至 2024年1月),具体内容如下
2025-02-27 09:50:00
见证人工智能的里程碑时刻! 英伟达夺回“股市之王”头衔
...公司都是英伟达的最大规模客户,并且他们在最近的业绩电话会议上仍然重点强调将在人工智能方面进行巨额支出的承诺,这些科技巨头的高管们都发表了“继续烧钱的评论”。华尔街投资机构们普
2024-11-06 14:45:00
英伟达市值超越德国上市公司市值总和,市值2.57万亿美元
...花旗将英伟达目标价从1030美元上调至1260美元。在英伟达电话会议上,英伟达(高管Kress)称,Blackwell芯片产能正满负荷运转
2024-05-23 23:50:00
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
2月27日凌晨,AI芯片霸主英伟达(NVDA.O)交出了新一季度的成绩单。图源:NVIDIA英伟达微信公众号2025财年第四季度(截至2025年1月26日)
2025-02-27 11:55:00
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...采购数量。亚马逊管理层在2024年三季度财报后的投资者电话会议中曾表示,亚马逊的自研芯片相比英伟达同规格产品拥有更高的性价比。《财经》从亚马逊云科技相关人士处了解到,在实际使
2024-12-04 09:49:00
戴尔科技涨超31%、英伟达收盘市值首次站上2万亿美元;这家银行又爆雷,一度跌超30%,白宫:继续关注
...业和国家的需求正在激增。”英伟达创始人兼CEO黄仁勋在电话会议上说,“我们的数据中心平台受到越来越多元化的驱动因素推动,无论是来自大型云服务提供商和专门的GPU提供商的数据处
2024-03-02 11:35:00
更多关于财经的资讯:
农行济南华山支行:烈日下的暖心守护 急事急办解民忧
近日,一通急促的电话打进了农行济南华山支行,电话那头,一位女士焦急地询问能否为行动不便的母亲办理社保卡,家中老人身体不适无法行走
2025-09-05 12:43:00
安普瑞斯(无锡)公司因违反产品认证规定被罚没374万余元
近日,无锡市市场监督管理局对安普瑞斯(无锡)有限公司作出行政处罚决定,因该公司存在多项违反强制性产品认证管理规定的行为
2025-09-05 12:44:00
“吉林银行杯”广场舞大赛热力启幕 反洗钱宣传随“舞”入民心
8月20日,吉林银行辽源分行联合辽源市老年体协举办的首届“吉林银行杯”广场舞大赛在欢乐荟开幕。活动邀请辽源电视台进行全程报道
2025-09-05 13:45:00
吉林银行辽源分行开展“反洗钱宣传进企业”系列活动
2025年8月,吉林银行辽源分行组织反洗钱宣传小组,开展“反洗钱宣传进企业”系列活动,为各企业管理层及一线员工举办专题为“筑牢反洗钱防线
2025-09-05 13:46:00
农行济南凤凰支行:普及金融知识 反诈护“夕阳”
“以前接到陌生电话总是难以分辨是否是诈骗电话,现在知道‘三不’原则,心里踏实多啦!”近日,在农行营业大厅里,刚听完反诈宣讲的王奶奶笑着说
2025-09-05 12:11:00
智元机器人入股华天电子旗下科技公司
近日,原江苏华芯智联信息科技有限公司发生工商变更,企业名称变更为江苏华智天成科技有限公司,同时新增智元机器人关联公司智元创新(上海)科技有限公司等为股东
2025-09-05 10:00:00
赣锋锂业等投资成立聚能智储技术公司
近日,青平聚能智储(深圳)技术有限公司成立,法定代表人为宋春阳,经营范围包含:工业互联网数据服务;商业综合体管理服务;软件开发等。企查查股权穿透显示,该公司由赣锋锂业(00246
2025-09-05 10:12:00
齐商银行:助力文旅企业提质发展
8月23日,正值二十四节气中的处暑,记者走进位于博山区的山东文旅·红叶柿岩旅游区。放眼望去,群山叠翠,绿意盎然。乘坐游览车沿着蜿蜒的山路而上
2025-09-05 10:22:00
天津市电力科技发展有限公司违规被罚
近日,信用能源公示了天津市电力科技发展有限公司的行政处罚决定。处罚决定书文号华北监能罚〔2025〕42号显示,2024年5月22日
2025-09-05 10:23:00
内蒙古华电辉腾锡勒风力发电有限公司违规被罚35万元
近日,信用能源公示了内蒙古华电辉腾锡勒风力发电有限公司的行政处罚决定。处罚决定书文号华北监能罚〔2025〕37号显示,内蒙古华电辉腾锡勒风力发电有限公司在未办理工程质量监督注册手续的情况下
2025-09-05 10:23:00
中国华电科工集团有限公司违规被罚10万元
近日,信用能源公示了中国华电科工集团有限公司的行政处罚决定。处罚决定书文号华北监能罚〔2025〕40号显示,2025年2月13日
2025-09-05 10:23:00
齐商银行“家庭贷”助养殖大户渡难关
8月21日下午2点,淄博气温高达38℃,热浪滚滚。高青县昊然牧场总经理李家如刚刚驱车180公里结束送奶工作返回牧场,又钻进养牛大棚
2025-09-05 10:24:00
齐商银行:“人才贷”助高科技人才创新创业
“我们前不久拿到了烟台一个客户1000多万元的订单,目前正在按客户的要求,加紧进行工业互联网实训室软件的设计和建设。”8月25日
2025-09-05 10:25:00
启迪环境控股子公司被罚60万元
近日,启迪环境(000826)发布关于控股子公司收到《行政处罚决定书》的公告。启迪环境于近日收到西安市阎良区应急管理局下发的行政处罚决定书((阎)应急罚[2025]1-005-2 号)
2025-09-05 10:25:00
嘉环科技新设子公司,含AI及物联网业务
近日,启东嘉环智能科技有限公司成立,法定代表人为倪毅,经营范围包含:人工智能应用软件开发;网络与信息安全软件开发;物联网设备销售;物联网技术服务;物联网技术研发等。企查查股权穿透
2025-09-05 10:00:00