• 我的订阅
  • 财经

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

类别:财经 发布时间:2024-03-02 13:38:00 来源:钛媒体APP
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

昨天凌晨,英伟达发布了2024财年第四季度财报,业绩再次超出预期。但比起亮眼的业绩,更让人印象深刻的是,英伟达在财报电话会议的一个观点:

推理端的爆发,可能很多人还是低估了。

据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,老黄总共提到了16次“推理”这个词提了,而“训练”只有8次。这也侧面证明了英伟达对推理端的重视。

据路透社与彭博2024年2月初报道,英伟达正在建立一个专注于为云计算、AI等领域设计ASIC专用芯片的新业务部门。之所以英伟达要布局ASIC,正是因为其看到了即将爆发的推理市场,不想出让这块即将到来的大蛋糕。在他们看来,凭借在能耗和性能方面的优势,ASIC在AI落地过程中拥有极大的潜力。

而随着推理端的爆发,AI芯片领域的格局或也将随之变化。

01 推理端走到爆发元年

除了英伟达这份财报,财报后电话会议里信息也不小。其中,“推理”是最重要的关键词。

在这里,先对推理做了一个简单的科普。现在AI的算力需求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。

对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每 token 的算力需求是常数,在训练阶段一般为 6 FLOPs,推理阶段则为 2 FLOPs。

由于当下大模型企业把更多的精力都花在提升大模型智能水平,因此绝大部分算力都被用在于训练阶段。但随着模型迭代逐渐走向停滞,加上越来越多AI应用的落地,推理侧的需要也在快速增加。

但即使如此,在英伟达最新的电话会议里,老黄仍然认为,推理需求在当下被极大低估,他给出的解释是:

“互联网有数万亿的信息容在3英寸见方的手机里,将所有这些信息整合到如此小的空间中,这是通过一个系统,一个称为推荐系统的令人惊叹的系统。

过去,些推荐系统都是基于CPU方法的,但最近向深度学习和生成式人工智能的迁移确实让这些推荐系统现在直接进入了GPU加速的道路,嵌入需要GPU加速、最近邻搜索需要GPU 加速、重新排序需要GPU加速,它需要GPU加速来为您生成增强信息,所以现在推荐系统的每一个步骤都用到了GPU。

如您所知,推荐系统是地球上最大的软件引擎,世界上几乎每一家大公司都必须运行这些大型推荐系统,每当您使用ChatGPT时,都会对其进行推断,每当你听说Midjourney以及他们为消费者生成的东西的数量时,当你看到Getty、我们与Getty和Adobe的Firefly所做的工作时,这些都是生成模型,这样的例子还在继续。正如我刚才提到的,这些都不是一年前存在的、100%全新的驱动力。“

类似的观点,月之暗面创始人杨植麟也曾表达过:26 年的时候也许模型用于推理的计算量会远远大于训练本身,可能花 10 倍的成本去推理,推理完之后花一倍的成本来训练,到时候推理就是训练。

老黄的意思很明确,总结起来一句话,2024年将成为推理端爆发元年。

02 押注ASIC

为了更好抓住推理端需求的爆发,英伟达正在做很多准备。据路透社与彭博2024年2月初报道,英伟达正在建立一个专注于为云计算、AI等领域设计ASIC专用芯片的新业务部门。

在解释英伟达为什么要做ASIC芯片前,我们先对AI芯片有一个简单的了解。目前,AI芯片主要分为CPU、GPU,这两个都很熟悉,还有FPGA(现场可编程门阵列,可以理解为半定制芯片),以及ASIC(定制芯片)。

根据GMInsight的统计,2022年全球AI芯片市场规模超过150亿美元,预计将在2032年超过4000亿美元,年复合增长率高达35%。而在去年出货量最大的依然是GPU,占比高达47%左右,第二名为占比34%的CPU,其次才是ASIC与FPGA,但ASIC已经隐隐有迎头赶超之势。

这里我们主要对比GPU与ASIC的差异。从特点上说,GPU更像是一大群工厂流水线上的工人,适合做大量的简单运算,很复杂的搞不了,但是简单的事情做得非常快。

与GPU不同,ASIC拥有性能高、体积小、功率低等特点,在特定领域定制后的效果远超CPU、GPU。比如,此前ASIC芯片就常被用于挖比特币。

由于ASIC芯片的设计和制造需要大量资金、较长的时间周期和工程周期,且一旦定制无法再次进行写操作,所以在模型快速迭代期,ASIC不是最优解。而随着模型迭代速度越来越慢,尤其到了应用阶段,ASIC针对特定需求开发,可根据需求对性能和功耗进行定向优化,其专用的芯片架构与高复杂度的算法相匹配,量产后在性能、功耗、成本方面均具有较大优势。

根据CSET报告《AI Chips: What They Are and Why They Matter》,相比CPU,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍。推理方面尤其好于GPU,见红框部分对比。

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

根据国海证券研报《GPT 5后NLP大模型逐步走向收敛,ASIC将大有可为》给出的数据,2025年ASIC在推理/训练应用占比分别达到40%、50%;在边缘侧,2025年ASIC在推理/训练应用占比分别达到70%、70%。

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了

而这也解释了英伟达为什么想要布局ASIC的原因:维持自身的产业优势,不想出让这块即将到来的大蛋糕。

03 英伟达的机会和挑战

从训练需求驱动到推理需求驱动,不仅是行业增长动力的变化,更可能是行业的一次重新洗牌。

在GPU领域,英伟达拥有绝对的统治力:根据 Liftr Insights 数据,2022 年数据中心 AI 加速市场中,英伟达份额达 82%。根据不久前的数据,2023年人工智能研究论文中使用的英伟达芯片比所有替代芯片的总和多19倍。

毫无疑问,英伟达是去年以来AI浪潮的最大赢家。2022年10月到现在,英伟达的股价从110美元左右上涨到近600美元,涨了500%。FactSet数据显示,此前20个季度,英伟达有19个季度的业绩都优于市场预期。

但ASIC的崛起,可能给英伟达带来些许变数。相比在GPU领域的一家独大,ASIC领域就显得热闹许多。

近年来,头部厂商纷纷开始切入ASIC领域,包括谷歌、英特尔、IBM在内等科技公司都有所动作。比如,2019年英特尔就收购了Habana Lab,并在2022年推出Gaudi2 ASIC芯片。

其中,谷歌在ASIC领域优势最明显。2021年推谷歌出TPU v4, 运算效能大幅提升,去年该芯片已经迭代到了v5,相比V4,训练速度和推理时间分别提高两倍和 2.5 倍。与英伟达顶级显卡A100相比,TPUv5p更是占据明显优势。根据谷歌官方数据显示,TPUv5p在训练任务上比A100快四倍以上。

尽管竞争者众,但英伟达也并非毫无优势。尤其在系统能力(软件通信算法等)上,其仍然具有明显优势。比如,目前基于自回归模型的推理是访存密集型算力,尤其是只要高并发型的应用服务,且单卡存算比例又不够的情况下,对片间互联能力的要求再次提高,NvLink的优势就再次凸显了。

据路透社同篇报道,目前英伟达已与亚马逊、Meta、微软、谷歌和OpenAI等科技巨头商讨设计ASIC芯片的合作事项,探讨创建定制芯片的机会。

尽管英伟达是否能在ASIC领域延续优势仍未可知。但有一点可以确定,随着推理需求的增加,英伟达在AI芯片领域的绝对优势将大概率被撕开一个口子,一家独家的局面将被打破。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-02 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AMD CEO苏姿丰:我们和英伟达观点不同 AI领域不存在“一刀切”
...是,近日,英伟达刚刚公布了其第四财季财报,在分析师电话会议上,英伟达认为DeepSeek的出世,让业界产生了AI人工智能可以不用太高端的硬件也能这么厉害,但现在看来这个情况并
2025-02-27 16:06:00
马斯克梦想AI超算霸权,旗下公司却\
...年数十亿美元的投入。”今年1月的特斯拉第四季度财报电话会议上,一位分析师询问了关于Dojo最新进展及特斯拉是否有“足够的英伟达GPU供应来训练该系统”的问题。马斯克回应表示,
2024-03-22 16:44:00
英伟达今年还能再涨60%?美银上调目标价:仍处主导地位
...率提升只会加快人工智能被采用和发展的速度。他在业绩电话会议上说,“DeepSeek R1 点燃了全球的热情。这是一项出色的创新,但更重要的是,它开源了一个世界级的推理AI模型
2025-03-03 11:04:00
英伟达:Deepseek,戳破了老黄的“皮衣”?
英伟达 (NVDA.O)北京时间2月27日凌晨,美股盘后发布 2025财年第四季度财报(截至 2024年1月),具体内容如下
2025-02-27 09:50:00
见证人工智能的里程碑时刻! 英伟达夺回“股市之王”头衔
...公司都是英伟达的最大规模客户,并且他们在最近的业绩电话会议上仍然重点强调将在人工智能方面进行巨额支出的承诺,这些科技巨头的高管们都发表了“继续烧钱的评论”。华尔街投资机构们普
2024-11-06 14:45:00
英伟达市值超越德国上市公司市值总和,市值2.57万亿美元
...花旗将英伟达目标价从1030美元上调至1260美元。在英伟达电话会议上,英伟达(高管Kress)称,Blackwell芯片产能正满负荷运转
2024-05-23 23:50:00
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
2月27日凌晨,AI芯片霸主英伟达(NVDA.O)交出了新一季度的成绩单。图源:NVIDIA英伟达微信公众号2025财年第四季度(截至2025年1月26日)
2025-02-27 11:55:00
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...采购数量。亚马逊管理层在2024年三季度财报后的投资者电话会议中曾表示,亚马逊的自研芯片相比英伟达同规格产品拥有更高的性价比。《财经》从亚马逊云科技相关人士处了解到,在实际使
2024-12-04 09:49:00
戴尔科技涨超31%、英伟达收盘市值首次站上2万亿美元;这家银行又爆雷,一度跌超30%,白宫:继续关注
...业和国家的需求正在激增。”英伟达创始人兼CEO黄仁勋在电话会议上说,“我们的数据中心平台受到越来越多元化的驱动因素推动,无论是来自大型云服务提供商和专门的GPU提供商的数据处
2024-03-02 11:35:00
更多关于财经的资讯:
50股2025年归母净利同比增速逾12%
根据Wind数据统计,截至2月9日,已有106家公司披露2025年业绩快报。其中,50股归母净利同比增速超过12%。二级市场来看,青岛银行、思源电气、佛燃能源披露快报后股价涨幅居
2026-02-10 09:23:00
贵州赫章农村商业银行股份有限公司因信贷管理不到位被罚款30万元
2月9日,国家金融监督管理总局毕节监管分局行政处罚信息公开表显示,贵州赫章农村商业银行股份有限公司因信贷管理不到位被罚款30万元;责任人徐某被警告。
2026-02-10 10:19:00
黔西花都村镇银行有限责任公司因信贷管理不到位被罚款30万元
2月9日,国家金融监督管理总局毕节监管分局行政处罚信息公开表显示,黔西花都村镇银行有限责任公司因信贷管理不到位被罚款30万元;责任人邓某俊被警告。
2026-02-10 10:20:00
中国平安财产保险茂名中心支公司因财务数据不真实等被罚款65万元 责任人同步领罚
2月9日,国家金融监督管理总局茂名监管分局行政处罚信息公示列表显示,中国平安财产保险股份有限公司茂名中心支公司因财务数据不真实;给予投保人保险合同约定以外的利益被罚款65万元。责
2026-02-10 10:20:00
广东化州农村商业银行因贷后管理严重违反审慎经营规则等被罚款60万元
2月9日,国家金融监督管理总局茂名监管分局行政处罚信息公示列表显示,广东化州农村商业银行股份有限公司因贷后管理严重违反审慎经营规则;不良贷款责任认定不到位,严重违反审慎经营规则被
2026-02-10 10:21:00
华安财产保险广东分公司茂名中心支公司因虚挂保险代理人业务套取费用被罚款43万元
2月9日,国家金融监督管理总局茂名监管分局行政处罚信息公示列表显示,华安财产保险股份有限公司广东分公司茂名中心支公司因车险手续费和劳务费超出经备案的附加费用率上限
2026-02-10 10:22:00
烟台市第二期迎双节惠民消费券将启动,“碰一下”支付最高立减100元
新春佳节将至,为持续释放消费潜力,给市民带来真真正正的福利,烟台市于2月10日至23日开展第二期迎双节惠民消费券活动。2月10日晚间19点起
2026-02-10 10:31:00
信立泰投资成立生命科学公司
近日,信立泰生命科学(深圳)有限公司成立,注册资本2200万元,经营范围包含:人体基因诊断与治疗技术开发。企查查股权穿透显示,该公司由信立泰(002294)全资持股。
2026-02-10 10:48:00
云深处科技新专利可提高人形机器人的跌倒恢复能力
近日,杭州云深处科技股份有限公司“机器人跌倒自恢复方法和装置”专利公布。企查查专利摘要显示,该方法包括:检测机器人的当前姿态
2026-02-10 11:00:00
华培动力、恒合股份投资成立智芯汽车电子公司
近日,上海华培数能智芯汽车电子有限公司成立,经营范围包含:电子元器件与机电组件设备销售;集成电路芯片及产品制造;集成电路芯片及产品销售
2026-02-10 11:00:00
供应链上下游协同效率提升2025年河北省物流业景气水平稳定向好河北新闻网讯(河北日报记者冯阳)近日,河北省物流与采购联合会
2026-02-10 08:09:00
节前市场供应充足 “菜篮子”产品量足价稳
春节临近,全国生活必需品市场供应品种丰富、库存充足、价格稳定,更好满足消费者多样化节日需求。清晨六点,在河北这家北方最大的农产品集散地
2026-02-10 07:57:00
2月9日晚间,温州意华接插件股份有限公司(下称“意华股份”,股票代码:002897)发布公告称,公司经审慎评估,决定将“乐清光伏支架核心部件生产基地建设项目”达到预定可使用状态的日期由2026年4月延期至2026年12月
2026-02-09 23:53:00
盘江股份电力板块2026年首月发电量超额完成6.75%
2月9日,记者从贵州盘江精煤股份有限公司获悉,2026年1月,公司电力板块超额完成月度发电目标6.75%,顺利实现首月发电量“开门红”
2026-02-10 02:44:00
2026年贵州将力争房地产开发投资完成1210亿元
2月9日,记者从2026年全省住房城乡建设工作会议获悉,2026年,贵州将力争房地产开发投资完成1210亿元、新增商品房销售面积2050万平方米
2026-02-10 03:47:00