• 我的订阅
  • 科技

AMD将构建全球最大AI训练集群,集成120万片GPU

类别:科技 发布时间:2024-06-27 14:09:00 来源:芯智讯
AMD将构建全球最大AI训练集群,集成120万片GPU

6月26日消息,据The Next Platform报道,近日AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。

120万片GPU 是一个非常惊人的数字,要知道目前全球最强的超级计算机Frontier 所配备的 GPU 数量才只有37888片,这也意味着AMD所支持的AI训练集群的GPU规模将达到Frontier的30多倍。不过,Forrest Norrod没有透露哪个组织正在考虑构建这种规模的AI系统,但确实提到“非常清醒的人”正在考虑在AI训练集群上花费数百亿到数千亿美元。

目前的AI训练集群通常由几千个 GPU 构建而成,这些 GPU 通过跨多个服务器机架或更少的高速互连连接。如果要创建一个拥有高达 120 万个 GPU 的单体 AI 集群,意味着将会面临极为复杂的高速互连网络,并且还会有延迟、功耗、硬件故障等诸多的问题,这似乎是难以实现的。

比如,AI工作负载对延迟非常敏感,尤其是尾部延迟和异常值,其中某些数据传输比其他数据传输花费的时间要长得多,并且会中断工作负载。此外,当今的超级计算机也会面临每隔几个小时就会发生的 GPU 或其他硬件故障。当扩展到当今最大的超级计算机集群的 30 倍时。更为关键的是,如此庞大的AI训练集群,将会产生极为庞大的能耗,不仅稳定的供电将会是一个大难题,而且配套的散热解决方案也面临巨大挑战。

编辑:芯智讯-浪客剑

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 18:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

amd助力构建全球最大单体人工智能训练集群
...表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。120万片GPU是一个非常惊人的数字
2024-06-28 02:31:00
AI集群,对抗英伟达的新“杀手锏”?
...思考如何将数量庞大的GPU构建成一个更大规模的超大规模集群。近日,AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示
2024-06-28 11:38:00
近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步
2025-02-05 11:06:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai
Nvidia今天透露,已经收购了Run:ai,一家开发优化显卡集群性能软件的初创公司。此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称
2024-04-26 13:43:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...pic,宣布与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练
2024-12-05 09:47:00
大模型\\\
...GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小的开销,核心瓶颈竟然是一块“看不见的短板”:存储带宽
2025-04-08 17:41:00
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算
2024-06-27 19:01:00
微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本
...吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%
2023-06-27 22:15:00
更多关于科技的资讯:
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:17:00
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:18:00
博士创新站典型案例|英利能源发展有限公司博士创新站:产学研协同破局,填补国内光伏质检领域技术空白
在“双碳”战略与光伏产业智能化转型背景下,英利能源联合河北工业大学陈海永博士团队共建博士创新站,成功研发并应用“光伏组件可靠性检测视觉大模型”
2025-12-30 11:40:00
在食品工业转型升级浪潮中,核桃精深加工与高附加值开发是产业高质量发展的关键。河北养元智汇饮品股份有限公司(以下简称“养元公司”)深耕核桃饮品领域多年
2025-12-30 11:40:00
博士创新站典型案例|河北鼎联科技有限公司博士创新站:校企联合攻关,驱动文博文旅产业智变
当前,文博文旅行业在数字化转型中面临数据资源分散、技术标准缺失、国外解决方案主导等瓶颈。河北鼎联科技有限公司联合河北地质大学杨丽花博士团队共建博士创新站
2025-12-30 11:45:00
专访“优秀侍茄师”马慧明: 雪茄爱好者到雪茄文化宣传者的蜕变之路
随着国产雪茄行业的快速发展,一个名为“侍茄师”的职业正悄然从冷门走向台前。他们不仅是雪茄文化的传承者,更是雪茄文化传播的核心力量
2025-12-30 11:50:00
教育与科技相交起舞—临沂联通“云网数智安”赋能区域教育数字化转型
鲁网12月30日讯 (记者 李文静 通讯员 沈慧卿)2025年7月,山东省教育厅等10部门联合印发《山东省“人工智能+教育”实施方案》
2025-12-30 11:52:00
“看不见的手术刀”尽显中国智造锋芒,海扶刀亮相国博中国制造“十四五” 成就展
什么是“看不见的手术刀”?它如何代表中国高端医疗设备制造的锋芒?2025年12月30日起,在中国国家博物馆举行的“筑基强国路——中国制造‘十四五’成就展”上
2025-12-30 13:13:00
薰风KUMPOO亮相广州文交会,共谱运动文化新章
创办于2017年的广州文交会,迄今已成功举办7届,展会规模、成交金额和影响力逐年提升,品牌效应和辐射功能逐步凸显,实现了从无到有
2025-12-30 13:51:00
3亿人参与冰雪运动后,天猫打造“雪上空港”再燃冰雪经济
12月25日,在距离北京市中心200公里的崇礼雪场,天猫打造了一场沉浸式冰雪大秀,在云顶雪场Big Air大跳台,交响乐团现场演奏与专业滑手大跳台专业表演交织
2025-12-30 11:05:00
火炬高新区已培育上百家国家级专精特新“小巨人”企业
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏 陈晓敏)如果要衡量区域的科创硬实力和发展后劲,专精特新“小巨人”企业的集聚度无疑是一个关键指标
2025-12-30 08:16:00
浙江日报讯 (记者 沈超 石磊 共享联盟·金华开发区 俞夏冰) 知识产权路演,是促进创新成果从实验室走向市场的关键一招
2025-12-30 08:39:00
野蛮生长近二十年的充电宝行业,不到半年就掉进了漩涡。据了解,工信部已于10月及11月多次组织召开《移动电源安全技术规范》征求意见稿研讨会
2025-12-30 08:40:00
在贵州省贵阳市的繁华商圈中,一家传统与现代相结合的特殊金融机构正悄然改变着人们对典当行业的刻板印象。贵州中泰星诚典当有限公司凭借其专业化
2025-12-30 08:52:00
OceanBase杨冰:技术产品领导者,如何“进化”为全球经营者?
第17个双11大促如期而至,淘宝天猫等平台热度依旧。在预售、开售等关键节点,数亿用户瞬时涌入,带来数据量的飙升,但消费者无论是浏览
2025-12-30 10:20:00