• 我的订阅
  • 科技

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

类别:科技 发布时间:2024-08-05 09:33:00 来源:新智元

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi,AI团队将「加倍投入」Dojo。‍

为了训出最强Grok 3,xAI耗时19天,打造了由10万块H100组成的世界最大超算集群。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

而在训练FSD、擎天柱机器人方面,马斯克同样不惜重金,投入了大量的计算资源。

超算Dojo,是特斯拉AI的基石,专为训练FSD神经网络而打造。

就在今天,他在德州超级工厂(Cortex)参观了特斯拉的超级计算机集群。

马斯克称,「这将是一个拥有约10万个H100/H200 GPU,并配备大规模存储的系统,用于全自动驾驶(FSD)和Optimus机器人的视频训练」。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

不仅如此,除了英伟达GPU,这个超算集群中还配备了特斯拉HW4、AI5、Dojo系统。

它们将由一个高达500兆瓦的大型系统提供电力和冷却。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

2021年特斯拉AI Day上,马斯克首次对外宣布Dojo。

如今三年过去了,Dojo建得怎样了?

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

8000块H100等价算力,加倍下注

半个月前,网友称2024年年底,特斯拉拥有AI训练算力,等价于9万块H100的性能。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

马斯克对此做了一些补充:

我们在AI训练系统中不仅使用英伟达的GPU,还使用自己的AI计算机——Tesla HW4 AI(更名为AI4),比例大约为1:2。 这意味着相当于有大约9万个H100,加上大约4万个AI4计算机。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

他还提到,到今年年底,Dojo 1将拥有大约8000个相当于H100算力。这个规模不算庞大,但也不算小。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

Dojo D1超算集群

其实在去年6月,马斯克曾透露Dojo已经在线并运行了几个月的有用任务。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

这已经暗示着,Dojo已经投入到一些任务的训练中。

最近,在特斯拉财报会议上,马斯克表示特斯拉准备在10月推出自动驾驶出租车,AI团队将「加倍投入」Dojo。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

预计Dojo的总计算能力,将在2024年10月达到100 exaflops。

假设一个D1芯片可以实现362 teraflops,要达到100 exaflops,特斯拉将需要超过27.6万个D1芯片,或者超过32万英伟达A100 GPU。

500亿晶体管,D1已投产

2021年特斯拉AI Day上,D1芯片初次亮相,拥有500亿晶体管,只有巴掌大小。

它具备了强大和高效的性能,能够快速处理各种复杂的任务。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

今年5月,D1芯片开始投产,采用台积电7nm工艺节点。

Autopilot前硬件高级总监Ganesh Venkataramanan曾表示,「D1可以同时进行计算和数据传输,采用定制ISA指令集架构,并针对机器学习工作负载进行了充分优化」。

这是一台纯粹的机器学习的芯片。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

尽管如此,D1仍没有英伟达A100强大,后者同样采用了台积电7nm工艺制造。

D1在645平方毫米的芯片上放置了500亿个晶体管,而A100包含540亿个晶体管,芯片尺寸为826平方毫米,性能领先于D1。

为了获得更高的带宽和算力,特斯拉AI团队将25个D1芯片融合到一个tile中,将其作为一个统一的计算机系统运作。

每个tile拥有9 petaflops的算力,以及每秒36 TB的带宽,并包含电力源、冷却和数据传输硬件。

我们可以将单个tile视为,由25台小型计算机组成的一台自给自足的计算机。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

通过使用晶圆级互连技术InFO_SoW(Integrated Fan-Out,System-on-Wafer),在同一块晶圆上的25块D1芯片可以实现高性能连接,像单个处理器一样工作。

6个这样的tile构成一个机架(rack),两个机架构成一个机柜(cabinet)。

十个机柜构成一个ExaPOD。

在2022年AI Day中,特斯拉表示,Dojo将通过部署多个ExaPOD进行扩展。所有这些加在一起构成了超级计算机。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

晶圆级处理器(wafer-scale processor),比如特斯拉的Dojo和Cerebras的晶圆级引擎WSE,比多处理器(multi-processor)的性能效率要高得多。

前者的主要优点包括内核之间的高带宽和低延迟通信、较低的电网阻抗以及更高的能源效率。

目前,只有特斯拉和Cerebras拥有晶圆上系统设计。

然而,将25个芯片放在一起对电压挑战和冷却系统也是不小的挑战。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

网友拍到特斯拉在德州建设巨型冷却系统

晶圆级芯片的固有挑战还在于,必须使用片上内存(on-chip memory),这不够灵活,可能无法满足所有类型的应用。

Tom's Hardware预测, 下一代使用的技术可能是CoW_SoW(Chip-on-Wafer),在tile上进行3D堆叠并集成HBM4内存。

此外,特斯拉还在研发下一代D2芯片,为了破解信息流难题。

与连接单个芯片不同,D2将整个Dojo tile放在了单个硅晶圆上。

到2027年,台积电预计将提供更复杂的晶圆级系统,计算能力预计将提升超过40倍。

自D1发布以来,特斯拉既没有公开已订购、预期接收的D1芯片订单情况,也没有公开Dojo超算的具体部署时间表。

不过在今年6月份的时候,马斯克曾表示,在未来18个月,一半部署特斯拉AI硬件,一半是英伟达/其他硬件。

其他硬件,也可能是AMD。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

为什么需要Dojo

自动驾驶耗算力

在我们的印象中,特斯拉的主业仅限于生产电动汽车,再附带一些太阳能电池板和储能系统的业务。

但马斯克对特斯拉的期望远远不止于此。

大多数自动驾驶系统,比如谷歌母公司Alphabet旗下的Waymo,仍旧依靠传统的感知器作为输入,比如雷达、激光雷达和摄像头等。

但特斯拉采取的是「全视觉」路径,他们仅依靠摄像头捕捉视觉数据,辅以高清地图进行定位,再使用神经网络处理数据以进行自动驾驶的快速决策。

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

直观来看,显然前者是一种更简单快捷的路径,事实也的确如此。

Waymo已经实现了L4级自动驾驶的商业化,即SAE所定义的,在一定条件下下无需人工干预即可自行驾驶的系统。但特斯拉的FSD(Full Self-Driving)神经网络仍无法脱离人类操作。

Andrej Karpathy曾在特斯拉担任AI负责人,他表示,实现FSD基本是在「从头开始构建一种人造动物」。

我们可以将其理解为人类视觉皮层和大脑功能的数字复制。FSD不仅需要连续收集和处理视觉数据,识别、分类车辆周围的物体,还需要有与人类相当的决策速度。

由此可见,马斯克想要的绝不只是能盈利的自动驾驶系统而已。他的目标,是打造一种新智能。

但幸运的是,他几乎不太需要担心数据不够的问题。目前大约有180万人为FSD支付了8000美元的订阅费(之前可达1.5万美元),这意味着特斯拉能收集到数百万英里的驾驶视频用于训练。

而算力方面,Dojo超算就是FSD的训练场。它的中文名字可以翻译为「道场」,是对武术练习空间的致敬。

英伟达不给力

英伟达GPU有多抢手?看看各大科技巨头的CEO有多想跟老黄套近乎就知道了。

即便财大气粗如马斯克,也会在7月的财报电话会上承认,自己对特斯拉可能没法用上足够的英伟达GPU感到「非常担忧」。

「我们看到的是,对英伟达硬件的需求如此之高,以至于通常很难获得GPU。」

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

目前,特斯拉似乎依旧使用英伟达的硬件为Dojo提供算力,但马斯克似乎不想把鸡蛋都放在一个篮子里。

尤其是考虑到,英伟达芯片的溢价如此之高,而且性能还不能让马斯克完全满意。

在硬件与软件协同这方面,特斯拉与苹果的观点类似,即应该实现两者的高度协同,尤其是FSD这种高度专门化的系统,更应该摆脱高度标准化的GPU,使用定制硬件。

这个愿景的核心,是特斯拉专有的D1芯片,于2021年发布,今年5月开始由台积电量产。

此外,特斯拉还在研发下一代D2芯片,希望将整个Dojo块放在单个硅片上,解决信息流瓶颈。

在第二季度财报中,马斯克指出,他看到了「通过Dojo与英伟达竞争的另一条途径」。

Dojo能成功吗

即便自信如马斯克,在谈到Dojo时,也会支支吾吾地表示,特斯拉可能不会成功。

从长远来看,开发自己的超算硬件可以为AI部门开拓新的商业模式。

马斯克曾表示,Dojo的第一个版本将为特斯拉的视觉数据标注和训练量身定制,这对FSD和训练特斯拉的人形机器人Optimus来说非常有用。

而未来版本将更适合通用的AI训练,但这不可避免地要踏入英伟达的护城河——软件。

几乎所有的AI软件都是为了与英伟达GPU配合使用,使用Dojo就意味着要重写整个AI生态系统,包括CUDA和PyTorch。

这意味着,Dojo几乎只有一条出路——出租算力,建立类似于AWS和Azure一样的云计算平台。

摩根士丹利在去年9月的报告中预测,Dojo可以通过robotaxi和软件服务等形式释放新的收入来源,为特斯拉的市值增加5000亿美元。

简言之,从目前马斯克对硬件的谨慎配比来看,Dojo并非「孤注一掷」而更像是一种双重保险。但一旦成功,也可以释放巨大红利。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-05 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

【马斯克命令英伟达向X运送数千枚特斯拉专用AI芯片】财联社6月4日电,英伟达内部电邮显示,马斯克向股东们夸大了特斯拉的采购情况。马斯克还将原本留给特斯拉的一大批AI处理器转给了他
2024-06-04 22:19:00
马斯克梦想AI超算霸权,旗下公司却\
3月22日消息,尽管埃隆·马斯克(Elon Musk)致力于打造能与英伟达抗衡的超级计算机,但他旗下公司与英伟达的关系却日益紧密
2024-03-22 16:44:00
特斯拉失宠?媒体曝其芯片被优先分配给AI公司 马斯克本人否认
财联社6月5日讯(编辑 赵昊)埃隆·马斯克曾多次表示,他可以将特斯拉打造成“人工智能和机器人领域的领导者”,这一雄心壮志需要英伟达提供大量昂贵的芯片来建设其基础设施。在4月份的财
2024-06-05 01:26:00
“偏心”xAI?马斯克回应芯片分配:给了特斯拉也只能“吃灰”
在AI芯片紧缺情况下,马斯克选择先”紧着“特斯拉,将算力资源分配给xAI。隔夜,特斯拉收涨0.86%,报174.77美元
2024-06-05 14:05:00
特斯拉开启AI投资狂潮?马斯克:除了英伟达,还打算买AMD芯片!
特斯拉(Tesla Inc. )首席执行官埃隆·马斯克(Elon Musk)表示,他计划从超威半导体(Advanced Micro Devices Inc
2024-01-27 19:00:00
仅次于 Meta,马斯克透露特斯拉囤积的英伟达 H100 芯片数量
IT之家 4 月 9 日消息,埃隆・马斯克麾下的特斯拉和其神秘的以人工智能为核心的公司 xAI,储备了大量的英伟达 H100 系列芯片
2024-04-09 09:24:00
对标英伟达B200!马斯克:特斯拉2025年末批量装备Dojo 2 AI训练芯片
快科技9月11日消息,据媒体报道,马斯克在出席All-In Summit 2024活动时表示,特斯拉的下代AI芯片Dojo 2将于2025年末批量装备
2024-09-11 19:15:00
黄仁勋2024年薪酬3400万美元:相比马斯克简直“白菜价”
...这一数字在美国大公司CEO中算是标准水平,但与特斯拉CEO马斯克近600亿美元的“天价薪酬”相比,简直就是白菜价。黄仁勋的薪酬构成主要包括现金奖励、年度业绩相关股票激励和多年
2024-06-27 13:44:00
美媒揭秘马斯克疯狂做法:牺牲特斯拉等为发展xAI提供资源!特斯拉股东起诉:将马斯克xAI股权转移给特斯拉
马斯克凤凰网科技讯 北京时间8月12日,据《华尔街日报》报道,埃隆·马斯克(Elon Musk)为他的人工智能创业公司xAI制定了一个宏大计划
2024-08-12 16:50:00
更多关于科技的资讯:
近年来,人工智能技术的快速发展正深刻改变各行各业的工作方式。在企业员工队伍建设方面,数字化、智能化转型已成为提升核心竞争力的关键路径
2025-11-04 18:10:00
喜良观经济|饿了么将改名?阿里在下什么棋?
11月4日,“饿了么APP更名为淘宝闪购”话题冲上热搜,网友称饿了么APP最新内测版本(12.0.1)已更名为“淘宝闪购”
2025-11-04 19:32:00
从全运赛场到千家万户:美的空调赛级标准成就大众的选择
第十五届全国运动会即将在粤港澳大湾区盛大启幕,笔者走进焕然一新的广东奥林匹克体育中心,现代化设施与科技感扑面而来——而在这座国家级主场的背后
2025-11-04 19:33:00
11月3日消息,第二十一届中国国际煤炭采矿技术交流及设备展览会日前在北京闭幕。中北高新区企业山西浩博瑞新材料有限公司推出的本安型低温系列新品
2025-11-04 19:06:00
论文变产品 智源成资源——西咸新区校地合作“开花结果”
华商网讯(记者 董旭叶)实验室里的尖端论文,如何能变成生产线上的畅销产品?高校的科研成果,又如何能化作服务产业、惠及民生的实物
2025-11-04 19:13:00
三联家电&云闪付消费补贴券,单件至高立减2000元
鲁网11月4日讯买家电怎样最划算?正值双十一家电消费旺季,这个疑问困扰着每一个需要家电换新的消费者。看不懂各平台复杂的满减机制
2025-11-04 17:37:00
2025年玛咖(玛卡)品牌综合评测:如何找到适合自己体质的调理方案?
在个性化健康日益成为主流的今天,男性对保健品的需求已从“大众配方”转向“个体化方案”。玛咖作为广受关注的植物补充剂,其功效虽获认可
2025-11-04 15:47:00
可梦AI开放测试获首批企业盛赞!“短剧男频标杆”的蜜糖网络实力入驻,共启AI短剧工业化新篇
短剧行业全流程智能平台可梦AI正式开启企业测试通道,凭借“真AI驱动全链路、需求响应极速、企业服务定制化”的核心优势,迅速赢得首批入驻企业的高度认可
2025-11-04 13:50:00
CFCA安心诉存证服务,融资租赁行业的电子证据守护者
目前,融资租赁行业正在快速向数字化转型迈进,行业内线上业务的繁荣发展,使得电子数据在交易出现司法纠纷时所起到的作用愈发重要
2025-11-04 13:51:00
当年轻人开始在夏天“进补”,巨量星图如何用一场计划“养”出多个品牌破圈增长
当养生成为这届年轻人的日常,一边熬夜一边搜索“祛湿攻略”,左手冰美式右手胶原蛋白,已成为他们的生活常态。对于大健康品牌来说
2025-11-04 13:52:00
平台化协同·场景为先--中叉网对话安庆联动属具公司的高质量跃迁
2025年8月上旬,“合力改变物流搬运方式--合力•中叉网 | 2025中国叉车和移动机器人高质量发展万里行”再次走进安徽叉车集团旗下的安庆联动属具股份有限公司
2025-11-04 13:52:00
智造能力的跃升,正在成为中国品牌突破创新的底气
智造能力的跃升,正在从结构上打破「高端化」市场格局。以厨电市场为例,以往在单价8万元/㎡以上住宅项目中,进口厨电占比高达78%
2025-11-04 08:12:00
畅通京津冀算力“高速路”!河北大力推进京津冀三地网络协同、服务协同、算力资源协同
河北大力推进京津冀三地网络协同、服务协同、算力资源协同畅通京津冀算力“高速路”10月17日,在2025中国国际数字经济博览会上
2025-11-04 08:12:00
厦门网讯(厦门日报记者 李晓平)近日,省工信厅公布省级人工智能硬件优质产品名单,全省18个入选产品中,厦门独占8席,包括瑞为
2025-11-04 08:38:00
在生成式AI重构流量分配格局的2025年,中国GEO服务商市场已形成清晰的三大梯队。据《2025中国生成式AI搜索生态白皮书》数据显示
2025-11-04 08:49:00