• 我的订阅
  • 科技

无惧限制 Intel为中国公司定制了一张AI大模型入场券

类别:科技 发布时间:2023-07-14 15:42:00 来源:快科技

一款名叫Gaudi2的AI芯片,2022年和2023年英特尔都为其开了一场发布会,为什么?

有两个方面的原因,一个在当前国际形势下的合规之举,另一个在生成式AI热潮下亮出的入场券。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

这里的入场券有两层含义,一层含义是对正在四处寻找合适芯片的AI大模型算法公司来说,英特尔的Gaudi2能够成为这些公司发展业务的算力基石,足够的算力大模型竞赛的入场券。

另一层含义是对于英特尔来说,拿出的能和英伟达最先进的H100 GPU比拼的产品,是其在AI大市场里披荆斩棘的入场券,也是一个“大杀器”。

站在AI的变革时刻,手握AI时代入场券的公司,如何才能成为AI时代的领导者?

英特尔有一个十分清晰的路线图,2025年将会推出更适合AI需求的芯片,新的产品将融合Gaudi和GPU。

Gaudi2再次发布的2个原因

2022年的英特尔On产业峰会上,英特尔发布了新一代高性能深度学习AI训练处理器Habana Gaudi2,那时的Gaudi2训练BERT模型的性能相比英伟达A100就有2倍的性能优势,广受关注。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

2023年7月,英特尔在北京又举行了一次Gaudi2的发布会,原因有两个。

“过去5个月大模型的演进非常快,去年发布audi2之后,我们做了大量软件模型的优化工作,可为大规模的多模态和语言模型提供出色的推理性能。”英特尔公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera说,“这次我们不只是带来了一颗芯片,还带来了基于Gaudi2可以大规模部署训练以及推理大模型的整体解决方案。”

为了市场需求再次发布是一个原因,另一个原因是因为政策。

“这次在中国发布的Gaudi2,是中国定制版产品,对于出口或支持中国的客户没有任何问题。”Sandra分享。

中国版Gaudi2和国际版最大的区别是网口的数量,国际版集成以太网端口数量是24个,中国版减少到了21个,这一变化会降低中国版Gadudi2网络速度,对整体的性能影响不大。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

这其实是在满足互联总线带宽不能超过400GB/s的美国出口法规限制。雷峰网(公众号:雷峰网)了解到,在法规的限制下,下一代Gaudi3在中国市场销售的版本也会和国际版有所不同。

用性价比和英伟达掰手腕

英特尔发布中国版Gaudi2并积极宣传的目的非常明确——从英伟达手上分一杯羹。

生成式AI火热之后,英伟达次新的A100和最新和H100 GPU在全球都成为了紧俏商品。在中国这种情况更加严重,并且因为有美国法规的限制,A100和H100并不能直接向中国市场出售,只能销售互联带宽更低的A800和H800。

这给包括英特尔在内的所有高性能AI加速芯片的提供者一个绝佳的机会,能从英伟达手里分一杯羹,就意味着抓住了AI这个未来十年甚至更长时间的大市场。

Gaudi2非常聪明地从性价比的角度与当下最强大的H100和A100竞争,这种聪明更直白的说就是抓住了用户最急切的需求。

“A100的定价相比此前的产品已经偏贵,到H100时定价已经贵的有些夸张,加上供货紧缺带来的价格上涨,H100让大量公司都对替代产品更有兴趣。”多位AI行业从业者都对雷峰网表示,“只要其它AI芯片的性能和体验达到英伟达的80%,价格是英伟达的一半,就一定有客户愿意买单。”

无惧限制 Intel为中国公司定制了一张AI大模型入场券

性价比可以借用数据直观体现。最受欢迎的AI开源模型提供商Hugging Face分享性能结果显示,Gaudi2在多种训练和推理基准测试中表现出的超过英伟达 A100 GPU的性能。在训练计算机视觉模型时,Gaudi2的每瓦性能是A100的2倍,对于1760亿参数的BLOOMZ推理,Gaudi2的每瓦性能是A100的60%,有全方位的能效比优势。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

再看AI领域权威的基准测试MLPerf在六月发布的最新结果。

Gaudi2和英伟达H100是唯二提交GPT-3模型训练结果的半导体解决方案。结果显示,Gaudi2在384个加速器上训练GPT-3的时间为311分钟,英伟达在512个H100 GPU上的训练时间则为64分钟。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

“这意味着,基于GPT-3模型,每个H100的性能领先于Gaudi2 3.6倍。”Habana Labs首席运营官Eitan Medina直言,“性价比是影响H100和Gaudi2相对价值的一个重要考量因素。Gaudi2服务器的成本要比H100低得多,所以Gaudi2的价格优势能够大大缩小了与H100的性价比差距。”

无惧限制 Intel为中国公司定制了一张AI大模型入场券
无惧限制 Intel为中国公司定制了一张AI大模型入场券

谈性价比,不能绕开软件,也就是使用体验。

几分钟就能迁移代码,Gaudi2高度适配大模型

芯片的使用体验,对于有开发经验的工程师来说是迁移的,对于没有代码的工程师来说是上手的难度。

Hugging Face 的首席布道者Julien Simon分享他使用Gaudi的经历,“在我第一次使用时,只花了10分钟,其中还包括阅读文档。在运行了我的加速脚本后,它立即就可以工作。我必须说这是我见过的最简单的开发体验之一,如果你有现成的代码,可以在几分钟内进行迁移。”

几分钟就能迁移原有模型的开发体验来源于英特尔针对Gaudi平台深度学习训练和推理优化的SynapseAI软件套件。这一软件套件集成PyTorch、TensorFlow、DeepSpeed框架,也支持Kubernetes编排,定制编译器。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

同时,SynapseAI软件套件也有强大的合作伙伴生态系统,包括Hugging Face、PyTorch Lightning、RedHat。其中,超过5万个模型在Hugging Face平台上使用Optimum Habana软件库进行了优化。

这让Gaudi2对大模型开发者非常友好,从github上也能看到Optimum Habana对大量大模型支持的情况。像是对Stable Diffusion(一个用于从文本生成图像的最先进生成式AI模型之一)训练,Gaudi2能够实现从1张卡至64张卡近线性99%的扩展性。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

随着软件优化的持续深入,开发者能够拥有更好的开发体验。而与Hugging Face的合作,也让开发者不用考虑英伟达的CUDA软件生态。

“确实很多人在用CUDA进行人工智能运算,但是大模型的开发者,大部分不会做那么底层的开发的,他们是在一个比较高的框架,比如PyTorch、TensorFlow上面做创新。”Sandra十分有信心,“我们和Hugging Face做了一些对策和合作,一些现有模型只花几十秒的时间就可以调通,能够运行在Gaudi上。”

“Gaudi2之前已经有一代产品,我们做了好几年积累,底层软件库都已经开发好。”Eitan补充,“我们希望让开发者能够在最上层的20%做他的开发,这里的开发和CUDA没有那么直接的关联。”

目前,浪潮信息已经发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7,这款服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。

英特尔也会打造基于Gaudi2的大规模集群,作为英特尔开发者云的一部分向中国客户提供。

2025年有更整合的GPU

Gaudi2是英特尔在大模型热潮里拿出的算力武器,但对于生成式AI的需求显然还不足够。

“明年我们会发布下一代产品Gaudi 3。”Sandra还透露,“2025年时,我们会把Gaudi的AI芯片与GPU路线图合二为一,推出一个更整合的GPU的产品。”

混合DSA(领域专用架构)是AI芯片领域明确的趋势,将Gaudi和GPU整合,既能发挥DSA的性能和能效优势,又能拥有GPU的通用性,这是高性能AI芯片公司都在努力的方向,但软件是一个挑战。

“从开发者的角度,他们更看重的是可持续的软件生态。”Sandra非常清楚,“在迭代产品的同时,我们要对开发者做最好的软件支持,让他们投入软件的一些代码能够在迭代的时候可以更好复用。”

当然,除了朝混合DSA的方向努力,英特尔还有丰富的AI产品组合的优势,包括CPU、GPU、FPGA和DSA。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

Sandra对雷峰网表示,“很多数据中心的客户有成百上千个至强,他们可以很方便的在现有的数据中心上用至强做一些简单的推理工作。对于千亿级参数的模型训练,需要像Gaudi这样在性能、性价比或者是在供电上都是有平衡考量的产品。GPU Max在科学计算领域可以提供更高的性能和性价比。”

百度智能云服务器高级经理何永占就分享了其使用至强的经验,集成英特尔AMX加速引擎的第四代英特尔至强可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化。

显然,英特尔在生成式AI热潮里已经交出了不错的答卷,接下来就要看其能在AI大市场里俘获多少客户的心。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-14 17:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

美国政府加速限制,要求英伟达立即停止A800/H800芯片销往中国|硅基世界
...主流的产品,是当前大范围用于国内 AI 大模型的重要“入场券”、模型训练的唯二芯片产品,另一款是华为昇腾910系列算力生态
2023-10-25 11:51:00
...工业和安全局(BIS)发布了针对芯片的出口禁令新规,对于中国半导体的制裁进一步升级。从新规名称可以看到,此次限制的核心对象是先进计算半导体、半导体制造设备和超级计算机项目。而
2023-10-19 15:05:00
英特尔发布中国特供版7nm AI芯片Gaudi2,减少RDMA接口以符合出口管制规定|硅基世界
...App获悉,7月11日,芯片巨头英特尔公司(Intel)发布面向中国市场、采用台积电7nm工艺的第二代Gaudi深度学习加速器Habana Gaudi2
2023-07-12 16:00:00
高通统治数字座舱后,英特尔:汽车不是手机|36氪专访
...市场,英特尔已经在水面下筹谋了近一年。据英特尔公司中国区技术部总经理高宇透露,2023年4月份疫情解封之后,英特尔CEO帕特·盖尔辛格来中国的第一站就拜访了极氪汽车,双方签下
2024-01-11 12:08:00
英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出|硅基世界
...audi 3 AI芯片(图片来源:Intel官网)关于英特尔Gaudi 3的“中国特供版” AI 芯片有了新进展。钛媒体App 4月15日消息
2024-04-15 17:00:00
围剿ChatGPT
...GPT。算力、商业化成挑战算力资源是这场大模型竞争中的入场券。“超过千亿级别的大模型,它的训练大概需要1000-2000张A100的卡
2023-04-25 14:30:00
力挺!Intel前CEO已在新公司用DeepSeek代替OpenAI
...方面的质疑,基辛格不屑一顾,他表示尽管大部分工作在中国完成,无法完全透明,但所有证据表明其训练成本比o1便宜10到50倍。对于隐私和审查制度的担忧,基辛格认为,“中国人提醒我
2025-01-29 20:37:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
图片来源@视觉中国【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、大数据领域的前沿趋势、重磅政策及行研报告。】商汤科技发布讣告:创始
2023-12-18 22:02:00
中国互联网企业价值40亿美元的英伟达高端芯片订单,面临取消风险。10月17日晚,美国商务部发布对中国大陆芯片出口管制条款更新版本,对2022年规则进行细化和升级。该版本进一步收紧
2023-10-20 18:12:00
更多关于科技的资讯:
大河网讯 9月6日,细雨蒙蒙,湿润的空气中带着淡淡的江水气息,山城重庆显得格外宁静。可在重庆国际博览中心内却是另一番景象——2025世界智能产业博览会正在这里举办
2025-09-06 22:20:00
2025智博会“四链”融合对接暨“渝链通”发布活动成功举办 助力科创企业融资破局
大河网讯 9月6日,2025世界智能产业博览会“四链”融合对接活动——智能产业股权融资专题对接暨“渝链通”服务方案发布会在重庆国际博览中心圆满举行
2025-09-06 22:20:00
从茶叶到瓶装茶,小罐茶高香无糖茶加速传统茶企转型
健康消费升级持续推动市场扩容,无糖茶赛道正迎来众多品牌加码布局。尽管消费场景细分和产品升级带动无糖茶市场与受众不断扩大
2025-09-06 15:51:00
大河网讯 人工智能是新一轮科技革命和产业变革的重要驱动力量,对全球经济社会发展和人类文明进步产生了深远影响。9月5日,2025世界智能产业博览会在长江之畔重庆开幕
2025-09-06 13:08:00
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00
本报讯(记者雷嘉)围绕国产车规级芯片搭载应用,北京市科委、中关村管委会会同北京市智慧城市基础设施与智能网联汽车协同发展办公室
2025-09-05 11:08:00
河北新闻网讯(王丽英)“后厨不只是生产中心,更是服务体验的心脏。”“服务不仅仅是完成交易的过程,更是以关怀为主利他主义精神的体现
2025-09-05 11:08:00
海信冰箱五款产品通过中国家用电器研究院自动制冰性能认证
日前,经中国家用电器研究院严格检测与评估,海信冰箱旗下五款产品成功通过“电冰箱自动制冰性能认证”,并获颁认证证书。此次获证不仅是对海信冰箱自动制冰技术性能的肯定
2025-09-05 11:57:00
京东全球80+高校招聘 清华、剑桥等80校专场 现场面试拿offer!
9月5日,京东招聘公众号发文:全球80+高校!京东2026校园招聘进校行程发布。文中称:将在全球20+城市,80+院校
2025-09-05 12:10:00
花一万元植入DeepSeek,一场没有终点的流量游戏
文|邓咏仪编辑|苏建勋让你的产品在DeepSeek的答案里有一席之地,需要多少钱?答案是:数千甚至上万元。人在哪,流量就在哪
2025-09-05 14:56:00
爱尔眼科开启老视多学科诊疗新时代
9月4日,2025年屈光性白内障手术国际论坛(IRCS)暨第一届老视矫正MDT管理国际高峰论坛在杭州举办我国超八成60岁以上老年人正面临老视(老花眼)与白内障的“双重眼病困扰”
2025-09-05 15:18:00
获SIAL创新奖:诺啦格兰诺拉脆片让生活更美好  
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。吉丽莎(广州)贸易有限公司选送的产品诺啦格兰诺拉脆片跻身TOP10
2025-09-05 15:18:00
桃李面包广告语引争议“五仁不好吃是你还年轻”官方账号发文:领导拍的板,这个锅只能他来背
近日,桃李面包一则电梯广告文案引发争议。社交平台上流传的图片显示,桃李蛋月烧产品的广告语写道:“有人说五仁不好吃,我们认为
2025-09-05 15:29:00