• 我的订阅
  • 科技

Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练

类别:科技 发布时间:2023-05-19 14:01:00 来源:智东西

当地时间5月18日,Meta在官网发布公告,为了应对未来十年AI算力需求急剧增长,Meta正执行一项宏伟计划——专为AI建设下一代基础设施。

Meta公布了其为AI构建下一代基础设施的最新进展,包括首款用于运行AI模型的定制芯片、一个全新的AI优化数据中心设计、首款视频转码ASIC,以及集成16000块GPU、用于加速AI训练的AI超级计算机RSC等。

Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练

Meta官网关于AI基础设施细节的披露

Meta将AI视为公司的核心基础设施。自从2010年Meta的第一个数据中心破土动工至今,AI已成为每天使用Meta系列应用程序的30多亿人的引擎。从2015年的Big Sur硬件到PyTorch的开发,再到去年Meta的AI超算的初步部署,Meta当下正将这些基础设施进一步升级进化。

01.Meta首代AI推理加速器7nm制程、102.4TOPS算力

MTIA(Meta Training and Inference Accelerator),是Meta第一个针对推理工作负载的内部定制加速器芯片系列。

AI工作负载在Meta的业务中中无处不在,这是广泛应用项目的基础,包括内容理解、信息流、生成式AI和广告排名等。随着AI模型的大小和复杂性的增加,底层硬件系统需要在保持效率的同时提供指数级增长的内存和计算。但Meta发现CPU难以满足其规模所需的效率水平需求,于是针对这一挑战设计了Meta自研训练和推理加速器MTIA ASIC系列。

自2020年起,Meta为其内部工作负载设计了第一代MTIA ASIC。该加速器采用台积电7nm工艺,运行频率为800MHz,在INT8精度下提供102.4TOPS算力,在FP16精度下提供51.2TFLOPS算力。它的热设计功率(TDP)为25W。

据介绍,MTIA提供了比CPU更高的计算能力和效率,通过同时部署MTIA芯片和GPU,其将为每个工作负载提供更好的性能、更低的延迟和更高的效率。

02.布局下一代数据中心开发首款视频转码ASIC

Meta的下一代数据中心设计将支持其当前的产品,同时支持未来几代AI硬件的训练和推理。这个新的数据中心将是面向AI优化设计,支持液冷AI硬件和连接数千个AI芯片的高性能AI网络,用于数据中心规模的AI训练集群。

据官网解读,Meta下一代数据中心还将更快、更经济地构建,并将补充其他新硬件,例如Meta的第一个内部开发的ASIC解决方案MSVP,旨在为Meta不断增长的视频工作负载提供动力。

随着生成式AI等新技术内容产生,人们对视频基础设施的需求进一步加剧,这推动Meta推出了一款可扩展视频处理器MSVP。

MSVP是Meta为内部开发的第一个用于视频转码的ASIC。MSVP是可编程和可扩展的,并且可以配置为有效地支持点播所需的高质量转码,以及直播所需的低延迟和更快的处理时间。未来,MSVP还将帮助为Meta应用系列的每个成员带来新形式的视频内容——包括AI生成的内容以及VR(虚拟现实)和AR(增强现实)内容。

Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练

MSVP的架构示意图

03.AI超算集成16000个GPU支持LLaMA大模型加速训练迭代

据Meta公告,其AI超级计算机(RSC)是世界上最快的人工智能超级计算机之一,旨在训练下一代大型AI模型,为新的AR工具、内容理解系统、实时翻译技术等提供动力。

Meta RSC具有16000个GPU,所有GPU都可以通过三级Clos网络结构访问,为2000个训练系统中的每个系统提供全带宽。在过去的一年里,RSC一直在推动像LLaMA这样的研究项目。

LLaMA是Meta在今年早些时候构建并开源的大型语言模型,具有650亿参数规模。Meta称其目标是提供一个更小、更高性能的模型,研究人员可以在不需要重要硬件的情况下对特定任务进行研究和微调。

Meta基于1.4万亿Tokens训练了LLaMA 65B和较小的LLaMA 33B。其最小的模型,LLaMA 7B,训练也用到了一万亿Tokens。大规模运行的能力允许Meta加速训练和调优迭代,比其他企业更快地发布模型。

04.结语:大模型技术应用倒逼大厂加速布局基础设施

Meta之所以自定义设计其大部分基础设施,主要是因为这能使其优化端到端的体验,包括从物理层到软件层再到实际的用户体验。因为从上到下控制堆栈,所以其可以根据自己的特定需求对其进行定制。这些基础设施将支持Meta开发和部署更大规模、更复杂的AI大模型。

在未来几年里,我们将看到芯片设计、专用和特定工作负载的AI基础设施、新系统和工具的专业化、定制化程度的提高,以及产品和设计支持效率的提高。这些都将提供建立在最新研究基础上的日益复杂的模型和产品,使世界各地的人们能够使用这种新兴技术。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-19 18:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...型的厂商,无一例外在AI领域都有足够积累,特别是底层基础设施层面,他们的实践也在验证“云是规模算力的最佳承载平台”这一判断。“为了打造AI超级计算机,微软早在2018年就开始
2023-06-29 12:00:00
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...靠片上 SRAM 的数据流企业,用户需要支持大型语言模型的基础设施更少。例如,想在 Llama 70B 上推理,对于有些 AI 芯片来说需要五百多个芯片
2024-10-21 09:55:00
张云泉:集中力量,促进国产AI大模型发展
...“主权AI”的概念,并将其定义为“一个国家利用自己的基础设施、数据、劳动力和商业网络生产AI的能力”。“主权AI ”涵盖物理和数据基础设施,后者就包括“主权级基础大模型”——
2024-09-03 14:17:00
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...了5倍。据科技媒体TechCrunch报道,谷歌云计算和机器学习基础设施副总裁兼总经理马克·洛迈尔(Mark Lohmeyer) 表示
2023-08-31 10:04:00
特斯拉,不仅仅是芯片
...式发展的秘诀。特斯拉目前拥有非常少量的内部人工智能基础设施,只有约 4000 个 V100 和约 16000 个 A100
2023-06-28 12:00:00
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...-4 的信息,今天我们想分享一下。这包括模型架构、训练基础设施、推理基础设施、参数计数、训练数据集组成、令牌计数、层数、并行策略、多模态视觉适应、不同工程权衡背后的思维过程、
2023-07-12 20:14:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...域可用性高达99.999%,可扩展性几乎无限,而且无需管理基础设施,无需配置、修补或管理数据库实例。Aurora DSQL克服了分布式数据库的两个历史挑战——实现多区域低延迟
2024-12-05 09:47:00
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...机,为实时计算提供支持。而这一次,从芯片到服务器,基础设施上一系列的更新动作,可以分为三大板块来看——计算(Compute)
2024-12-05 09:45:00
16家头部大模型公司上海神秘碰头,现场人挤人人人
...键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直
2024-05-30 17:18:00
更多关于科技的资讯:
比黄金涨的还猛!羽毛球价格上涨100% 网友纷纷提前囤货
快科技4月1日消息,近两年,众所周知,黄金价格真是一路狂飙。今日上午10点25分,黄金涨至3139.92美元的新纪录高位
2025-04-01 19:09:00
本文转自:人民网人民网北京4月1日电 (记者夏晓伦)当下,消费市场的竞争日益激烈,餐饮行业也在不断探寻新的发展路径与价值增长点
2025-04-01 19:16:00
全自研高性能RISC-V服务器芯片在前海首发
本文转自:人民网睿思芯科创始人、CEO谭章熹正式发布灵羽处理器。主办方供图人民网深圳4月1日电 (刘森君)3月31日,深圳前海企业睿思芯科举办2025春季新品发布会
2025-04-01 19:35:00
比亚迪腾势赵长江:Z9GT 120km/h追尾大货车 电池完好无损没有起火自燃
快科技4月1日消息,车辆碰撞后电池起火事件频发,再次引发大家对于新能源车安全的关注。今日,腾势销售事业部总经理赵长江微博发文称
2025-04-01 19:40:00
比亚迪腾势汽车3月销量达12620辆:平均成交价36.5万元
快科技4月1日消息,2025年4月1日,腾势汽车发布最新销量数据。3月,腾势汽车累计销量达12620辆,同比增长22.8%
2025-04-01 19:40:00
SU7爆燃致3人死亡:小米汽车遭遇最严峻的信任危机
经历了一整晚的微信聊天记录发酵之后,小米SU7在安徽高速上智驾发生车祸,导致三名花季少女丧生的命案,登上了热榜的头条。巨大的舆论风波背后
2025-04-01 19:40:00
女子冒风烧纸祈福引燃9辆车 官方通报:刑拘
快科技4月1日消息,清明将至,又到了祭祖祈福的时候,尤其需要提醒大家注意用火安全。据“北京朝阳消防”最新通报,3月30日
2025-04-01 19:40:00
10年来最大改版iOS 19六月登场!3款iPhone遭淘汰无缘升级
快科技4月1日消息,苹果将于6月10日举办WWDC开发者大会,届时将公开新一代iOS 19操作系统,有消息称这将是近十年来iOS系统最大幅度的改版
2025-04-01 19:40:00
连续53年吃35000个汉堡!美国72岁奇男子创纪录:非常健康
这绝对是一个不良的示范,但美国男子唐纳德·戈斯克(DonaldGorske)是个幸运儿!他是麦叔叔家巨无霸的“终极粉丝”
2025-04-01 19:40:00
天钡新款迷你机首发4099元:锐龙7 Pro 8845HS、6个3.5寸硬盘位
快科技4月1日消息,天钡WTR MAX“NAS型迷你主机”已经上市,首发4099元。新款迷你机采用全新模具,全金属一体化构造
2025-04-01 19:40:00
中国科大实现毫秒级可集成量子存储器
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队的李传锋、周宗权研究组基于团队原创的无噪声光子回波方案
2025-04-01 19:49:00
夫妻自如租房5年:妻子多项指标异常
4月1日消息,据媒体报道,一对夫妻在杭州租住自如房屋5年,妻子体检发现多项指标异常,包括胸闷、过敏性咽炎、抵抗力降低、肺部结节
2025-04-01 20:10:00
十堰广电讯(全媒体记者 张陈堰 朱江 通讯员 纪宏新)3月底,世界规模最大原址保护的恐龙蛋化石遗址青龙山恐龙蛋化石群,首次成功尝试运用三维激光扫描技术
2025-04-01 20:24:00
携手十五载 共赢新未来:新克尔光电生产基地乔迁佛山
3月29日,广东新克尔光电科技有限公司(以下简称:新克尔光电)在佛山市三水区中南高科高端电子信息港举行生产基地乔迁仪式暨年度供应商大会
2025-04-01 20:26:00
海外媒体宣发:如何用全球声音塑造品牌影响力
一、案例启示:国际品牌的破圈密码在当今全球化的市场环境下,品牌影响力的提升已成为企业在激烈竞争中脱颖而出的关键因素。海外媒体发稿作为一种高效的品牌传播方式
2025-04-01 20:52:00