• 我的订阅
  • 科技

无惧限制 Intel为中国公司定制了一张AI大模型入场券

类别:科技 发布时间:2023-07-14 15:42:00 来源:快科技

一款名叫Gaudi2的AI芯片,2022年和2023年英特尔都为其开了一场发布会,为什么?

有两个方面的原因,一个在当前国际形势下的合规之举,另一个在生成式AI热潮下亮出的入场券。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

这里的入场券有两层含义,一层含义是对正在四处寻找合适芯片的AI大模型算法公司来说,英特尔的Gaudi2能够成为这些公司发展业务的算力基石,足够的算力大模型竞赛的入场券。

另一层含义是对于英特尔来说,拿出的能和英伟达最先进的H100 GPU比拼的产品,是其在AI大市场里披荆斩棘的入场券,也是一个“大杀器”。

站在AI的变革时刻,手握AI时代入场券的公司,如何才能成为AI时代的领导者?

英特尔有一个十分清晰的路线图,2025年将会推出更适合AI需求的芯片,新的产品将融合Gaudi和GPU。

Gaudi2再次发布的2个原因

2022年的英特尔On产业峰会上,英特尔发布了新一代高性能深度学习AI训练处理器Habana Gaudi2,那时的Gaudi2训练BERT模型的性能相比英伟达A100就有2倍的性能优势,广受关注。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

2023年7月,英特尔在北京又举行了一次Gaudi2的发布会,原因有两个。

“过去5个月大模型的演进非常快,去年发布audi2之后,我们做了大量软件模型的优化工作,可为大规模的多模态和语言模型提供出色的推理性能。”英特尔公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera说,“这次我们不只是带来了一颗芯片,还带来了基于Gaudi2可以大规模部署训练以及推理大模型的整体解决方案。”

为了市场需求再次发布是一个原因,另一个原因是因为政策。

“这次在中国发布的Gaudi2,是中国定制版产品,对于出口或支持中国的客户没有任何问题。”Sandra分享。

中国版Gaudi2和国际版最大的区别是网口的数量,国际版集成以太网端口数量是24个,中国版减少到了21个,这一变化会降低中国版Gadudi2网络速度,对整体的性能影响不大。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

这其实是在满足互联总线带宽不能超过400GB/s的美国出口法规限制。雷峰网(公众号:雷峰网)了解到,在法规的限制下,下一代Gaudi3在中国市场销售的版本也会和国际版有所不同。

用性价比和英伟达掰手腕

英特尔发布中国版Gaudi2并积极宣传的目的非常明确——从英伟达手上分一杯羹。

生成式AI火热之后,英伟达次新的A100和最新和H100 GPU在全球都成为了紧俏商品。在中国这种情况更加严重,并且因为有美国法规的限制,A100和H100并不能直接向中国市场出售,只能销售互联带宽更低的A800和H800。

这给包括英特尔在内的所有高性能AI加速芯片的提供者一个绝佳的机会,能从英伟达手里分一杯羹,就意味着抓住了AI这个未来十年甚至更长时间的大市场。

Gaudi2非常聪明地从性价比的角度与当下最强大的H100和A100竞争,这种聪明更直白的说就是抓住了用户最急切的需求。

“A100的定价相比此前的产品已经偏贵,到H100时定价已经贵的有些夸张,加上供货紧缺带来的价格上涨,H100让大量公司都对替代产品更有兴趣。”多位AI行业从业者都对雷峰网表示,“只要其它AI芯片的性能和体验达到英伟达的80%,价格是英伟达的一半,就一定有客户愿意买单。”

无惧限制 Intel为中国公司定制了一张AI大模型入场券

性价比可以借用数据直观体现。最受欢迎的AI开源模型提供商Hugging Face分享性能结果显示,Gaudi2在多种训练和推理基准测试中表现出的超过英伟达 A100 GPU的性能。在训练计算机视觉模型时,Gaudi2的每瓦性能是A100的2倍,对于1760亿参数的BLOOMZ推理,Gaudi2的每瓦性能是A100的60%,有全方位的能效比优势。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

再看AI领域权威的基准测试MLPerf在六月发布的最新结果。

Gaudi2和英伟达H100是唯二提交GPT-3模型训练结果的半导体解决方案。结果显示,Gaudi2在384个加速器上训练GPT-3的时间为311分钟,英伟达在512个H100 GPU上的训练时间则为64分钟。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

“这意味着,基于GPT-3模型,每个H100的性能领先于Gaudi2 3.6倍。”Habana Labs首席运营官Eitan Medina直言,“性价比是影响H100和Gaudi2相对价值的一个重要考量因素。Gaudi2服务器的成本要比H100低得多,所以Gaudi2的价格优势能够大大缩小了与H100的性价比差距。”

无惧限制 Intel为中国公司定制了一张AI大模型入场券
无惧限制 Intel为中国公司定制了一张AI大模型入场券

谈性价比,不能绕开软件,也就是使用体验。

几分钟就能迁移代码,Gaudi2高度适配大模型

芯片的使用体验,对于有开发经验的工程师来说是迁移的,对于没有代码的工程师来说是上手的难度。

Hugging Face 的首席布道者Julien Simon分享他使用Gaudi的经历,“在我第一次使用时,只花了10分钟,其中还包括阅读文档。在运行了我的加速脚本后,它立即就可以工作。我必须说这是我见过的最简单的开发体验之一,如果你有现成的代码,可以在几分钟内进行迁移。”

几分钟就能迁移原有模型的开发体验来源于英特尔针对Gaudi平台深度学习训练和推理优化的SynapseAI软件套件。这一软件套件集成PyTorch、TensorFlow、DeepSpeed框架,也支持Kubernetes编排,定制编译器。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

同时,SynapseAI软件套件也有强大的合作伙伴生态系统,包括Hugging Face、PyTorch Lightning、RedHat。其中,超过5万个模型在Hugging Face平台上使用Optimum Habana软件库进行了优化。

这让Gaudi2对大模型开发者非常友好,从github上也能看到Optimum Habana对大量大模型支持的情况。像是对Stable Diffusion(一个用于从文本生成图像的最先进生成式AI模型之一)训练,Gaudi2能够实现从1张卡至64张卡近线性99%的扩展性。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

随着软件优化的持续深入,开发者能够拥有更好的开发体验。而与Hugging Face的合作,也让开发者不用考虑英伟达的CUDA软件生态。

“确实很多人在用CUDA进行人工智能运算,但是大模型的开发者,大部分不会做那么底层的开发的,他们是在一个比较高的框架,比如PyTorch、TensorFlow上面做创新。”Sandra十分有信心,“我们和Hugging Face做了一些对策和合作,一些现有模型只花几十秒的时间就可以调通,能够运行在Gaudi上。”

“Gaudi2之前已经有一代产品,我们做了好几年积累,底层软件库都已经开发好。”Eitan补充,“我们希望让开发者能够在最上层的20%做他的开发,这里的开发和CUDA没有那么直接的关联。”

目前,浪潮信息已经发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7,这款服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。

英特尔也会打造基于Gaudi2的大规模集群,作为英特尔开发者云的一部分向中国客户提供。

2025年有更整合的GPU

Gaudi2是英特尔在大模型热潮里拿出的算力武器,但对于生成式AI的需求显然还不足够。

“明年我们会发布下一代产品Gaudi 3。”Sandra还透露,“2025年时,我们会把Gaudi的AI芯片与GPU路线图合二为一,推出一个更整合的GPU的产品。”

混合DSA(领域专用架构)是AI芯片领域明确的趋势,将Gaudi和GPU整合,既能发挥DSA的性能和能效优势,又能拥有GPU的通用性,这是高性能AI芯片公司都在努力的方向,但软件是一个挑战。

“从开发者的角度,他们更看重的是可持续的软件生态。”Sandra非常清楚,“在迭代产品的同时,我们要对开发者做最好的软件支持,让他们投入软件的一些代码能够在迭代的时候可以更好复用。”

当然,除了朝混合DSA的方向努力,英特尔还有丰富的AI产品组合的优势,包括CPU、GPU、FPGA和DSA。

无惧限制 Intel为中国公司定制了一张AI大模型入场券

Sandra对雷峰网表示,“很多数据中心的客户有成百上千个至强,他们可以很方便的在现有的数据中心上用至强做一些简单的推理工作。对于千亿级参数的模型训练,需要像Gaudi这样在性能、性价比或者是在供电上都是有平衡考量的产品。GPU Max在科学计算领域可以提供更高的性能和性价比。”

百度智能云服务器高级经理何永占就分享了其使用至强的经验,集成英特尔AMX加速引擎的第四代英特尔至强可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化。

显然,英特尔在生成式AI热潮里已经交出了不错的答卷,接下来就要看其能在AI大市场里俘获多少客户的心。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-14 17:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

美国政府加速限制,要求英伟达立即停止A800/H800芯片销往中国|硅基世界
...主流的产品,是当前大范围用于国内 AI 大模型的重要“入场券”、模型训练的唯二芯片产品,另一款是华为昇腾910系列算力生态
2023-10-25 11:51:00
...工业和安全局(BIS)发布了针对芯片的出口禁令新规,对于中国半导体的制裁进一步升级。从新规名称可以看到,此次限制的核心对象是先进计算半导体、半导体制造设备和超级计算机项目。而
2023-10-19 15:05:00
英特尔发布中国特供版7nm AI芯片Gaudi2,减少RDMA接口以符合出口管制规定|硅基世界
...App获悉,7月11日,芯片巨头英特尔公司(Intel)发布面向中国市场、采用台积电7nm工艺的第二代Gaudi深度学习加速器Habana Gaudi2
2023-07-12 16:00:00
高通统治数字座舱后,英特尔:汽车不是手机|36氪专访
...市场,英特尔已经在水面下筹谋了近一年。据英特尔公司中国区技术部总经理高宇透露,2023年4月份疫情解封之后,英特尔CEO帕特·盖尔辛格来中国的第一站就拜访了极氪汽车,双方签下
2024-01-11 12:08:00
英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出|硅基世界
...audi 3 AI芯片(图片来源:Intel官网)关于英特尔Gaudi 3的“中国特供版” AI 芯片有了新进展。钛媒体App 4月15日消息
2024-04-15 17:00:00
围剿ChatGPT
...GPT。算力、商业化成挑战算力资源是这场大模型竞争中的入场券。“超过千亿级别的大模型,它的训练大概需要1000-2000张A100的卡
2023-04-25 14:30:00
力挺!Intel前CEO已在新公司用DeepSeek代替OpenAI
...方面的质疑,基辛格不屑一顾,他表示尽管大部分工作在中国完成,无法完全透明,但所有证据表明其训练成本比o1便宜10到50倍。对于隐私和审查制度的担忧,基辛格认为,“中国人提醒我
2025-01-29 20:37:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
图片来源@视觉中国【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、大数据领域的前沿趋势、重磅政策及行研报告。】商汤科技发布讣告:创始
2023-12-18 22:02:00
中国互联网企业价值40亿美元的英伟达高端芯片订单,面临取消风险。10月17日晚,美国商务部发布对中国大陆芯片出口管制条款更新版本,对2022年规则进行细化和升级。该版本进一步收紧
2023-10-20 18:12:00
更多关于科技的资讯:
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:48:00
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:49:00
2025长三角伴手礼名单揭晓,有道词典笔行业独家上榜
日前,长三角消保委联盟举办“2025长三角伴手礼”评测活动,经过专业测评优中择优,为消费者推荐各行各业的优质品牌和放心产品
2025-12-24 18:37:00
2025年最省电的空调推荐?跟着趋势选,节能与舒适一站到位!
随着绿色家居理念深入人心,2025年家电消费市场的“节能属性”愈发凸显,空调作为居家高频耗电大户,“省电能力”已成为消费者选购时的核心考量
2025-12-24 22:03:00
科技攻“尖”产业向“新”,盈康一生打造医工创新策源地
近日,“AI for Health助力健康中国2030——第二届海医汇医疗科技创新生态大会”在北京隆重举行。作为海尔集团旗下大健康生态品牌
2025-12-24 22:04:00
中国蓝新闻讯 随着全球多地气温骤降,“取暖需求”持续升温。作为全球小商品贸易的风向标,义乌市场早已嗅到商机,各类取暖、保暖设备进入产销旺季
2025-12-24 16:53:00
鲁网12月24日讯近期,工行临沂兰山批发城支行为全面贯彻国家关于深化普惠金融服务、支持实体经济发展的战略方针,积极响应金融监管机构关于加大普惠金融力度的政策导向
2025-12-24 14:44:00
《次第花开》首期圆满落幕,女性成长新时代启航
近日,她创美好赋能学园首期传承营——《次第花开》在学员的满载收获中圆满落幕。本次课程汇聚了来自各行业的优秀女性,通过为期三天的系统学习
2025-12-24 11:31:00
千企齐聚利雅得,深度链接沙特“2030愿景”---- 2025沙特中国出口品牌联展启幕
12月22日,2025沙特中国出口品牌联展(以下简称“沙特联展”)在沙特利雅得前沿会展中心开幕。作为首次落地沙特的中国出口品牌系列展
2025-12-24 11:34:00
凭何赢得央视频认可? 成都普济中医以专业实力诠释“身边的肿瘤康复专家”
在国家“健康中国”战略深入推进的背景下,树立医疗健康领域的优质标杆,传播科学、规范的实践模式,已成为推动行业高质量发展的重要途径
2025-12-24 11:44:00
大皖新闻讯 近日,安徽敏航科技有限公司与北京魔康科技发展有限公司进行“数智赋能·空域共生”无人机战略合作签约,双方建立全面战略合作伙伴关系
2025-12-24 12:32:00
数据驱动的仓储革命:中感智能清仓机器人如何成为企业积累工艺数据资产的关键
当前,全球工业领域正加速向智能化、无人化转型,国家政策亦持续鼓励“机械化换人、自动化减人、智能化无人”,以提升本质安全水平与生产效率
2025-12-24 10:31:00
中新经纬12月24日电 针对法国仓遭遇盗抢事件,京东回应中新经纬称,北京时间12月22日,位于法国巴黎地区的京东仓储遭遇盗抢
2025-12-24 10:32:00
厦门网讯(厦门日报记者 楚燕 通讯员 陈雯 李欣)在患者脑中植入电极片,设备就能实时解码患者意图,通过穿戴式设备帮助患者实现抬手
2025-12-24 08:04:00
太晓红摘要:金融科技的崛起对传统商业银行的经营影响极为深远,通过重塑其成本结构、拓展收入边界、优化资产质量,显著提升了传统商业银行的盈利能力
2025-12-24 06:39:00