我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AMD MI300绝杀英伟达H100？跑GPT-4性能超25%，AI芯片大决战一触即发

类别：科技发布时间：2023-11-06 15:12:00 来源：新智元

新智元报道

编辑：好困 Aeneas

【新智元导读】面对即将到来的AI芯片大决战，不少芯片初创公司跃跃欲试，希望一举打破英伟达的垄断地位。而AMD的MI300，在部署32K上下文窗口的GPT-4模型时，居然比H100效果更好？

AI芯片大决战，即将来临！

AI硬件开发商初创公司的未来会怎样？

Tenstorrent CEO David Bennett直言不讳地表示，在我们这个行业，大部分初创公司的结局就是倒闭。

该如何生存？他建议初创企业应该保持灵活性，避免将自己局限在狭隘的用例中。

这里，Bennett指的并不是某个小众市场，而是由SiMa.ai到Cerebras等数十家公司组成的一个广泛集团。他们共同筹集了数十亿美元的风投，来对抗这个市场的领导者——英伟达。

Bennett深谙此道。他曾在AMD从事销售工作十多年。

而他目前的雇主Tenstorrent的CEO，是Jim Keller，一位硬件传奇人物。他曾开发出支持iPhone 4和iPad 2的苹果A4和A5处理器，并在2016年至2018年负责特斯拉自动驾驶汽车的硬件工作。

AMD MI300绝杀英伟达H100？跑GPT-4性能超25%，AI芯片大决战一触即发

Tenstorrent公司已经从富达风投和现代汽车等投资者筹集了超过3亿美元的资金，它遵循了Bennett的建议：从芯片到云计算等，提供一切服务。

Bennett表示，如今的芯片初创公司，大致都是在「为AI制造专用硬件」和「依赖当下流行模式」这两者之间徘徊。

英伟达的劣势：很难从头制造芯片

英伟达的AI芯片GPU起家的故事，实际上为今天的芯片初创公司提供了优势。

图形处理单元起初是为计算机图形学提供动力的，但由于它能并行执行多种计算，才在AI应用领域大放异彩。

不过，但这一意外也给英伟达带来了不利因素——现在，英伟达很难在不影响现有GPU业务的情况下，从头开始制造芯片了，而这，就给了新兴初创公司提供了机会，制造专为AI打造的新硬件。

比如，Tenstorrent的工程师就为未来的稀疏神经网络设计了Grayskull芯片，在这种网络中，冗余信息可以被去除。

尽管如此，Bennett认为，专注于为大语言模型构建芯片的初创公司，和Transformer架构捆绑得太紧了。

在这种架构下，基于Transformer的模型基本是在预测最有可能出现的下一个单词，因此它们一直被诟病生成的回答是基于概率，而非基于推理。

这也就意味着，在当前的AI热潮中，这些模型架构可能无法幸存下来。

毕竟，由于发展速度太快，如今的LLM寿命相对较短。昨天还炙手可热的模型，一两周后可能就会销声匿迹。

另一个对硬件公司来说风险很大的领域，就是制造专门用于推理的芯片。

这方面的代表是芯片开发商d-Matrix，它计划在明年上半年发布推理专用芯片。

乍一看，这个策略似乎不错。生成式AI应用的用户现在会越来越多地利用现有的专有或开源模型，而不是从头开始构建自己的模型。

正因如此，许多人认为，应该在模型推理上花更多钱，而非模型训练上。

虽然从商业角度来看，这可能是一个明智之举，但Bennett认为，过于狭隘地专注于推理，会阻碍硬件开发人员为其他可能更受欢迎的用例提供服务。

例如，对于运行模型所需的低精度计算，纯推理芯片就够了。

但是，如果开发者想要微调大模型，就很可能需要能处理更高精度计算的芯片了。

尖端芯片，把GPU和CPU放在一起

为了在即将到来的AI芯片大决战中幸存，芯片开发商需要改变芯片的架构。

今天，大多数芯片都是把GPU和CPU分开的。前者能够同时执行多种计算，后者负责执行更多的通用指令，管理更广泛的系统操作。

然而越来越多的尖端芯片（如英伟达的Grace Hopper 超级芯片和AMD即将推出的MI300A），都将GPU和CPU放在一起。

这种布局可以让CPU更快地准备数据，将数据加载到GPU上，从而加快模型的训练。

另外，硬件初创公司想要打破英伟达的市场主导地位，还面临着一个最大的障碍，就是软件优势。

英伟达用于编写机器学习应用程序的Cuda软件，只能在自家芯片上运行。而这实际上就把开发者锁定在了英伟达GPU上。

AMD MI300跑GPT-4更6

英伟达的霸主地位，就这么难以撼动？

Semianalysis记者Dylan Patel和Myron Xie最近就发文称，AMD的MI300在性价比方面，将会明显优于英伟达的H100！

他们表示，随着新一代MI300的推出，AMD即将成为英伟达和谷歌在LLM推理领域唯一的竞争对手。

相比之下，Groq、SambaNova、英特尔、亚马逊、微软等公司仍无法与之抗衡。

此外，为了应对英伟达基于CUDA构建的护城河，AMD一直在大力投资自己的RoCM软件、PyTorch生态系统和OpenAI的Triton。

随着Databricks、AI21、Lamini、Moreph等公司开始使用AMD GPU进行推理/训练，AMD自己的生态也愈发完善。

据业内人士透露，拥有更大显存的MI300，在部署32K上下文窗口的GPT-4模型时效果更好。

具体来说，与H100相比，MI300的性能优势在20%到25%之间，具体取决于上下文长度和提示长度/每次查询输出的token数量。

再加上更低廉的价格，MI300在性价比方面，将会明显优于英伟达的H100，甚至是H200。

大厂纷纷下单

目前，微软、Meta、甲骨文、谷歌、Supermicro/Quantadirect、亚马逊等公司已经向AMD下了大约205,000台MI300的订单。

在这之中，有120,000台专门供应给微软，25,000台给Meta，12,000台给甲骨文，8,000台给谷歌，5,000台给亚马逊公司，35,000台给其他公司。

而且由于数量巨大，微软购买MI300的价格预计要比其他客户低上不少。

为了计算MI300在明年为AMD带来的收入，需要从两个角度进行分析：AMD能确保多少供应量，以及主要客户会订购多少。

在供应方面，MI300的产能将在年内逐步提升，但由于英伟达B100会在第二季度开始出货，并在第三季度随着性价比更高的风冷版的推出而大幅提升，这将在很大程度上影响AMD在第四季度的出货量。

同时，还需要考虑内存制造商的HBM产量、CoWoS产量、封装产量以及使用CoWoS生产的每种加速器的情况，包括英伟达、AMD、Google/Broadcom、Meta/Broadcom、Intel/Al Chip、Amazon/Al Chip、Amazon/Marvell、Microsoft/GUC等。

即便如此，业内依然认为MI300X第四季度的出货量可以达到110,000台。

客户方面，微软、Meta、甲骨文、谷歌、Supermicro/Quantadirect和亚马逊是订单的主要来源，但也有一些订单来自供应链的其他部分，包括一些用于HPC型应用的MI300A。

利润方面，英伟达并没有降价的迹象，只是在价格不变的情况下增加了HBM容量/带宽。而与英伟达超过80%的利润率相比，AMD在MI300上的利润率仅勉强超过了50%。

AMD首席执行官苏姿丰表示，基于公司在AI方面的快速进展以及云计算客户的购买承诺，数据中心GPU的收入预计将在第四季度达到4亿美元，2024年将超过20亿美元。

这一增长也将使MI300成为AMD历史上销售额最快达到10亿美元的产品。

对此，业内对于MI300X的销售额则更加乐观——预期可以达到35亿美元。

从AMD目前在LLM训练和推理领域小于0.1%的市场份额来看，AMD在数据中心领域的市场份额依然会稳步增长。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-11-06 18:45:23

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于英伟,大决战,芯片,性能,英伟,芯片的资讯：

英伟达恢复中国特供版AI芯片出货：适应新政策，H20性能调整

近期，英伟达对外宣布将恢复向中国市场供应特供版的AI芯片，这一决策标志着美国对中国高科技产品销售的态度似乎出现了某种程度的软化。据悉，这些特供版芯片将在2024年第二季度开始量产

2024-01-11 00:15:00

传英伟达中国特供AI芯片开始预订性能或落后华为910B

【CNMO新闻】日前，CNMO了解到，有知情人士称，英伟达公司已经开始通过经销商接受其中国特供版AI芯片H20的订单，价格也已出炉。另外两款专门提供给中国市场的芯片还有L20和L

2024-02-02 11:00:00

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...狐科技作者 | 梁昌均在全球算力荒的情况下，AI芯片巨头英伟达加速算力竞赛。当地时间11月13日，英伟达宣布推出新一代人工智能芯片H200，称其是目前世界“最强”的AI芯片。

2023-11-14 14:05:00

“去英伟达化”加速！Meta、谷歌接连发布自研芯片，英伟达能

在这个由数据和算力驱动的时代，英伟达以其高性能的GPU芯片，几乎垄断了AI芯片市场。而随着AI竞争的加剧，芯片供应的紧缺，包括Meta、谷歌、亚马逊在内的科技巨头开始探索自研芯片

2024-04-13 16:40:00

英伟达特供芯片卖不动了？黄仁勋穿上东北花袄“示好”，中国大厂

算力芯片的火，从2023年一直燃烧到2024年。开年不久，英伟达CEO黄仁勋时隔四年到访中国大陆，还穿上了东北大花袄与国内员工共舞，气氛无比热络，似乎是在对自家芯片遇冷的传言进行

2024-01-30 16:23:00

老黄再出奇招！首推「特供版」GB20服务器，或将明年上市

【新智元导读】外媒爆料，英伟达将于明年推出一款专为中国市场定制的AI芯片，甚至还专研了一款与之搭配的服务器，这在英伟达历史上还是首次。英伟达与美国商务部的角力又升级了！在美国出口

2024-07-27 09:31:00

英伟达为何把华为列为最大竞争对手？

因为AIGC的火爆，让英伟达创造了一个又一个奇迹，在资本市场单日增幅达到了2770亿美元，黄仁勋的个人财富也来到了全球20强俱乐部的门口。而且，英伟达的业绩预期还要增长。在高性能

2024-02-26 10:54:00

老黄祭出史上最强 AI 芯片B200！30倍性能提升，AI

...纱。北京时间3月19日（星期二）凌晨，在年度GTC大会上，英伟达（Nvidia）首席执行官黄仁勋宣布推出AI超级芯片——Blackwell GB200

2024-03-19 13:00:00

ChatGPT掀AI热潮这些芯片厂商将“狂飙”

...芯片的需求将暴增，给低迷的半导体行业带来一股暖流，英伟达、三星电子、SK海力士等都将受益。但是英伟达服务器用AI芯片方案存在发热和功耗过大的问题，谷歌、亚马逊AWS、三星电子

2023-02-14 14:00:00

更多关于科技的资讯：

创新内容与读者的连接方式，磨铁图书亮相2026北京图书订货会

在2026北京图书订货会上，磨铁携大量优质内容产品亮相。围绕“磨铁，总有新的____”这一slogan，磨铁通过沉浸式的展陈设计

2026-01-12 11:27:00

当科学成为产业的语言：从光谱技术的全景比较，看“中国原创”的

在现代科学体系中，真正具有影响力的成果，往往不在于“做出一个新产品”，而在于重新定义一个领域的地图。这正是清华大学电子系鲍捷教授团队

2026-01-12 11:27:00

《数字化的力量》第2版获2025年度百大好书推荐

近日，京东图书联合光明网正式公布“2025年度百大好书”榜单。神州数码董事长郭为所著《数字化的力量》第2版，凭借其深刻的行业洞察

2026-01-12 13:58:00

践行金融为民护航青春无“险”——光大银行信用卡筑牢青年金融

2025年，光大银行信用卡深入把握大学生等青年群体的金融消费特征，聚焦其风险痛点与权益诉求，通过“精准化宣教、场景化服务

2026-01-12 13:58:00

储热技术取得新突破，工业节能迎来新利器浙大团队研制出可快充

近日，国际顶级学术期刊《自然》发表了我国科学家在储热技术领域的一项重要突破。浙江大学能源工程学院研究员范利武团队与其合作者提出全新的“滑移强化接触熔化”机制

2026-01-12 08:22:00

企业深度访谈：头部网站建设公司如何破冰，确立网页UI设计、系

企业深度访谈对象：北京分形科技有限公司媒体：企业家日报在数字化转型浪潮中，高端网站建设已从单纯的信息展示，升级为集品牌形象

2026-01-12 08:56:00

我用AI造轮胎——“车间里的AI”系列报道之一

在中策橡胶临江制造工厂，轮胎生产制造全程由机器人完成。本报记者曹坚摄当你走进一家传统的轮胎制造工厂，会看到什么？可能是轰鸣的机器

2026-01-12 09:23:00

双十一卖爆，连续五年天猫销冠！这个国货卸妆凭什么？

近年来，随着护肤步骤精细化与彩妆使用日常化，卸妆已成为中国美妆市场中增长最为迅猛的赛道之一。在这一充分竞争的市场中，衡量品牌实力的标尺日益清晰

2026-01-12 09:26:00

烟台毓璜顶医院专家直播1月15日开讲：直面卵巢功能减退，科学

胶东在线1月12日讯（记者栾雪通讯员李成修王婧）备孕路上，你是否也曾被“卵巢功能减退”的诊断打乱节奏？是否一边焦虑卵子质量

2026-01-12 10:37:00

超清晰视觉，全球共鉴，高德智感ApexVision闪耀CES

冬日的拉斯维加斯星光熠熠，全球目光持续聚焦一年一度的科技盛会——CES美国国际消费电子展。来自中国的红外热成像领军企业高德智感Guide Sensmart（展位号

2026-01-12 09:26:00

对话“死了么”App创始人：团队只有三人都是“95后”

近日，苹果应用商店一款名为“死了么”的App受到关注，据悉，该应用是为独居人群打造的轻量化安全工具，用户需要设置紧急联系人并签到

2026-01-12 09:28:00

联想笔记本两天涨了400多元、小米手机提价500元，还有品牌

因为AI的快速发展，过去一年里内存、硬盘和显卡都经历了显著上涨，对硬件终端的影响也终于爆发。开年以后，许多人发现多个品牌的笔记本电脑迎来了意想不到的涨价

2026-01-12 07:52:00

贯通生态，链接未来：ISPO Beijing 2026在京盛

2026年1月9日，亚太地区运动生活方式产业的开年风向标，ISPO Beijing 2026亚洲运动用品与时尚展于北京国家会议中心隆重启幕

2026-01-12 07:56:00

山西转型综改示范区多点发力冲刺首季“开门红”

新年伊始，奋进正当时，在“十五五”开局的关键节点，山西转型综改示范区锚定发展目标抢订单、抓生产、拓市场，全力冲刺第一季度“开门红”

2026-01-12 07:05:00

技术正在重新定义音效设计

近年来，音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用，使行业内部出现了关于“声音设计是否需要标准化

2026-01-09 14:49:00

头条订阅服务

AMD MI300绝杀英伟达H100？跑GPT-4性能超25%，AI芯片大决战一触即发