• 我的订阅
  • 科技

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

类别:科技 发布时间:2023-11-06 15:12:00 来源:新智元

新智元报道

编辑:好困 Aeneas

【新智元导读】面对即将到来的AI芯片大决战,不少芯片初创公司跃跃欲试,希望一举打破英伟达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?

AI芯片大决战,即将来临!

AI硬件开发商初创公司的未来会怎样?

Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,大部分初创公司的结局就是倒闭。

该如何生存?他建议初创企业应该保持灵活性,避免将自己局限在狭隘的用例中。

这里,Bennett指的并不是某个小众市场, 而是由SiMa.ai到Cerebras等数十家公司组成的一个广泛集团。他们共同筹集了数十亿美元的风投,来对抗这个市场的领导者——英伟达。

Bennett深谙此道。他曾在AMD从事销售工作十多年。

而他目前的雇主Tenstorrent的CEO,是Jim Keller,一位硬件传奇人物。他曾开发出支持iPhone 4和iPad 2的苹果A4和A5处理器,并在2016年至2018年负责特斯拉自动驾驶汽车的硬件工作。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

Tenstorrent公司已经从富达风投和现代汽车等投资者筹集了超过3亿美元的资金,它遵循了Bennett的建议:从芯片到云计算等,提供一切服务。

Bennett表示,如今的芯片初创公司,大致都是在「为AI制造专用硬件」和「依赖当下流行模式」这两者之间徘徊。

英伟达的劣势:很难从头制造芯片

英伟达的AI芯片GPU起家的故事,实际上为今天的芯片初创公司提供了优势。

图形处理单元起初是为计算机图形学提供动力的,但由于它能并行执行多种计算,才在AI应用领域大放异彩。

不过,但这一意外也给英伟达带来了不利因素——现在,英伟达很难在不影响现有GPU业务的情况下,从头开始制造芯片了,而这,就给了新兴初创公司提供了机会,制造专为AI打造的新硬件。

比如,Tenstorrent的工程师就为未来的稀疏神经网络设计了Grayskull芯片,在这种网络中,冗余信息可以被去除。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

尽管如此,Bennett认为,专注于为大语言模型构建芯片的初创公司,和Transformer架构捆绑得太紧了。

在这种架构下,基于Transformer的模型基本是在预测最有可能出现的下一个单词,因此它们一直被诟病生成的回答是基于概率,而非基于推理。

这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。

毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就会销声匿迹。

另一个对硬件公司来说风险很大的领域,就是制造专门用于推理的芯片。

这方面的代表是芯片开发商d-Matrix,它计划在明年上半年发布推理专用芯片。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

乍一看,这个策略似乎不错。生成式AI应用的用户现在会越来越多地利用现有的专有或开源模型,而不是从头开始构建自己的模型。

正因如此,许多人认为,应该在模型推理上花更多钱,而非模型训练上。

虽然从商业角度来看,这可能是一个明智之举,但Bennett认为,过于狭隘地专注于推理,会阻碍硬件开发人员为其他可能更受欢迎的用例提供服务。

例如,对于运行模型所需的低精度计算,纯推理芯片就够了。

但是,如果开发者想要微调大模型,就很可能需要能处理更高精度计算的芯片了。

尖端芯片,把GPU和CPU放在一起

为了在即将到来的AI芯片大决战中幸存,芯片开发商需要改变芯片的架构。

今天,大多数芯片都是把GPU和CPU分开的。前者能够同时执行多种计算,后者负责执行更多的通用指令,管理更广泛的系统操作。

然而越来越多的尖端芯片(如英伟达的Grace Hopper 超级芯片和AMD即将推出的MI300A),都将GPU和CPU放在一起。

这种布局可以让CPU更快地准备数据,将数据加载到GPU上,从而加快模型的训练。

另外,硬件初创公司想要打破英伟达的市场主导地位,还面临着一个最大的障碍,就是软件优势。

英伟达用于编写机器学习应用程序的Cuda软件,只能在自家芯片上运行。而这实际上就把开发者锁定在了英伟达GPU上。

AMD MI300跑GPT-4更6

英伟达的霸主地位,就这么难以撼动?

Semianalysis记者Dylan Patel和Myron Xie最近就发文称,AMD的MI300在性价比方面,将会明显优于英伟达的H100!

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

他们表示,随着新一代MI300的推出,AMD即将成为英伟达和谷歌在LLM推理领域唯一的竞争对手。

相比之下,Groq、SambaNova、英特尔、亚马逊、微软等公司仍无法与之抗衡。

此外,为了应对英伟达基于CUDA构建的护城河,AMD一直在大力投资自己的RoCM软件、PyTorch生态系统和OpenAI的Triton。

随着Databricks、AI21、Lamini、Moreph等公司开始使用AMD GPU进行推理/训练,AMD自己的生态也愈发完善。

据业内人士透露,拥有更大显存的MI300,在部署32K上下文窗口的GPT-4模型时效果更好。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

具体来说,与H100相比,MI300的性能优势在20%到25%之间,具体取决于上下文长度和提示长度/每次查询输出的token数量。

再加上更低廉的价格,MI300在性价比方面,将会明显优于英伟达的H100,甚至是H200。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

大厂纷纷下单

目前,微软、Meta、甲骨文、谷歌、Supermicro/Quantadirect、亚马逊等公司已经向AMD下了大约205,000台MI300的订单。

在这之中,有120,000台专门供应给微软,25,000台给Meta,12,000台给甲骨文,8,000台给谷歌,5,000台给亚马逊公司,35,000台给其他公司。

而且由于数量巨大,微软购买MI300的价格预计要比其他客户低上不少。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

为了计算MI300在明年为AMD带来的收入,需要从两个角度进行分析:AMD能确保多少供应量,以及主要客户会订购多少。

在供应方面,MI300的产能将在年内逐步提升,但由于英伟达B100会在第二季度开始出货,并在第三季度随着性价比更高的风冷版的推出而大幅提升,这将在很大程度上影响AMD在第四季度的出货量。

同时,还需要考虑内存制造商的HBM产量、CoWoS产量、封装产量以及使用CoWoS生产的每种加速器的情况,包括英伟达、AMD、Google/Broadcom、Meta/Broadcom、Intel/Al Chip、Amazon/Al Chip、Amazon/Marvell、Microsoft/GUC等。

即便如此,业内依然认为MI300X第四季度的出货量可以达到110,000台。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

客户方面,微软、Meta、甲骨文、谷歌、Supermicro/Quantadirect和亚马逊是订单的主要来源,但也有一些订单来自供应链的其他部分,包括一些用于HPC型应用的MI300A。

利润方面,英伟达并没有降价的迹象,只是在价格不变的情况下增加了HBM容量/带宽。而与英伟达超过80%的利润率相比,AMD在MI300上的利润率仅勉强超过了50%。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

AMD首席执行官苏姿丰表示,基于公司在AI方面的快速进展以及云计算客户的购买承诺,数据中心GPU的收入预计将在第四季度达到4亿美元,2024年将超过20亿美元。

这一增长也将使MI300成为AMD历史上销售额最快达到10亿美元的产品。

对此,业内对于MI300X的销售额则更加乐观——预期可以达到35亿美元。

从AMD目前在LLM训练和推理领域小于0.1%的市场份额来看,AMD在数据中心领域的市场份额依然会稳步增长。

AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-06 18:45:23

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达恢复中国特供版AI芯片出货:适应新政策,H20性能调整
近期,英伟达对外宣布将恢复向中国市场供应特供版的AI芯片,这一决策标志着美国对中国高科技产品销售的态度似乎出现了某种程度的软化。据悉,这些特供版芯片将在2024年第二季度开始量产
2024-01-11 00:15:00
传英伟达中国特供AI芯片开始预订 性能或落后华为910B
【CNMO新闻】日前,CNMO了解到,有知情人士称,英伟达公司已经开始通过经销商接受其中国特供版AI芯片H20的订单,价格也已出炉。另外两款专门提供给中国市场的芯片还有L20和L
2024-02-02 11:00:00
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...狐科技作者 | 梁昌均在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。
2023-11-14 14:05:00
“去英伟达化”加速!Meta、谷歌接连发布自研芯片,英伟达能否捍卫霸主地位?
在这个由数据和算力驱动的时代,英伟达以其高性能的GPU芯片,几乎垄断了AI芯片市场。而随着AI竞争的加剧,芯片供应的紧缺,包括Meta、谷歌、亚马逊在内的科技巨头开始探索自研芯片
2024-04-13 16:40:00
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
算力芯片的火,从2023年一直燃烧到2024年。开年不久,英伟达CEO黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行
2024-01-30 16:23:00
老黄再出奇招!首推「特供版」GB20服务器,或将明年上市
【新智元导读】外媒爆料,英伟达将于明年推出一款专为中国市场定制的AI芯片,甚至还专研了一款与之搭配的服务器,这在英伟达历史上还是首次。英伟达与美国商务部的角力又升级了!在美国出口
2024-07-27 09:31:00
英伟达为何把华为列为最大竞争对手?
因为AIGC的火爆,让英伟达创造了一个又一个奇迹,在资本市场单日增幅达到了2770亿美元,黄仁勋的个人财富也来到了全球20强俱乐部的门口。而且,英伟达的业绩预期还要增长。在高性能
2024-02-26 10:54:00
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...纱。北京时间3月19日(星期二)凌晨,在年度GTC大会上,英伟达(Nvidia)首席执行官黄仁勋宣布推出AI超级芯片——Blackwell GB200
2024-03-19 13:00:00
ChatGPT掀AI热潮 这些芯片厂商将“狂飙”
...芯片的需求将暴增,给低迷的半导体行业带来一股暖流,英伟达、三星电子、SK海力士等都将受益。但是英伟达服务器用AI芯片方案存在发热和功耗过大的问题,谷歌、亚马逊AWS、三星电子
2023-02-14 14:00:00
更多关于科技的资讯:
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00
OPC“最强大脑”集结 高德空间智能开发者大赛全国总决赛在苏州落幕
江南时报讯 “‘智能遛狗小助手’帮你制定更合理的遛狗计划。”“出门旅游,帮你一站式行程管理。”“无障碍出行,AI轻松识别障碍物
2026-01-11 16:26:00
合肥创新院举办“汽车+”产业科创企业路演
大皖新闻讯 为搭建产业与资本的高效对接桥梁,推动汽车科技创新成果转化,助力创新创业企业成长,近日,2026“汽车+”产业科创企业新年路演在合肥创新院举办
2026-01-11 16:52:00
在吉林,机器人也开始“卷”滑雪了!
当双足机器人蹒跚滑下雪道,当机械臂在-20℃寒风中精准投出雪球……这些充满未来感的画面,如今正在吉林的冰天雪地里真实上演
2026-01-11 15:05:00
中新经纬1月11日电 国家医保局网站11日发布《国家医疗保障局办公室关于开展个人医保云建设试点申报工作的通知》(以下简称《通知》
2026-01-11 12:46:00
都市快报讯 昨天上午,上城区同协路旁的西子智慧产业园迎来了一名特殊的“保安”——身高1.8米,通体银色金属光泽,走起路来
2026-01-11 08:22:00
人形机器人“入职”前的试炼场来了杭州日报讯 核心提示2025年被称为人形机器人量产元年,今年人形机器人步入量产关键期,如何让机器人理解并适应人类真实的世界
2026-01-11 08:22:00
河北新闻网讯(崔梦露)1月8日下午,平安产险唐山中心支公司通过抖音、微信视频号、平安好车主、平安好生活等四大线上平台,举办“开年迎好运家家有平安”直播活动
2026-01-09 21:11:00
在全球制造业向高质量升级的浪潮下,超高压技术正成为破解多行业性能瓶颈的关键支撑。作为全球超高压领域标杆企业,Quintus专注于超高压技术的研发与应用
2026-01-10 20:59:00
为规范互联网应用程序个人信息收集使用活动,保护个人信息权益,促进个人信息合理利用,根据《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《网络数据安全管理条例》等法律法规
2026-01-10 21:56:00
浙江造,红遍中国年!万事利春晚红围巾成“新年硬通货”
随着2026马年临近,一条承载马年春晚吉祥寓意的红围巾,正成为年末备受瞩目的新春佳礼。作为总台文创官方合作品牌,万事利丝绸匠心推出的“骐骥驰骋”系列围巾与丝巾
2026-01-10 21:02:00
摄像头自动识违规!雄安的这个工地很“智慧”
1月4日上午,雄安新区启动区中国中化大厦二期项目施工现场,一个安装在工地入口的摄像头缓缓转动。当镜头捕捉到两名未按规定穿戴反光背心的工人走向施工区域时
2026-01-10 17:01:00