• 我的订阅
  • 科技

AMD将构建全球最大AI训练集群,集成120万片GPU

类别:科技 发布时间:2024-06-27 14:09:00 来源:芯智讯
AMD将构建全球最大AI训练集群,集成120万片GPU

6月26日消息,据The Next Platform报道,近日AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。

120万片GPU 是一个非常惊人的数字,要知道目前全球最强的超级计算机Frontier 所配备的 GPU 数量才只有37888片,这也意味着AMD所支持的AI训练集群的GPU规模将达到Frontier的30多倍。不过,Forrest Norrod没有透露哪个组织正在考虑构建这种规模的AI系统,但确实提到“非常清醒的人”正在考虑在AI训练集群上花费数百亿到数千亿美元。

目前的AI训练集群通常由几千个 GPU 构建而成,这些 GPU 通过跨多个服务器机架或更少的高速互连连接。如果要创建一个拥有高达 120 万个 GPU 的单体 AI 集群,意味着将会面临极为复杂的高速互连网络,并且还会有延迟、功耗、硬件故障等诸多的问题,这似乎是难以实现的。

比如,AI工作负载对延迟非常敏感,尤其是尾部延迟和异常值,其中某些数据传输比其他数据传输花费的时间要长得多,并且会中断工作负载。此外,当今的超级计算机也会面临每隔几个小时就会发生的 GPU 或其他硬件故障。当扩展到当今最大的超级计算机集群的 30 倍时。更为关键的是,如此庞大的AI训练集群,将会产生极为庞大的能耗,不仅稳定的供电将会是一个大难题,而且配套的散热解决方案也面临巨大挑战。

编辑:芯智讯-浪客剑

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 18:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

amd助力构建全球最大单体人工智能训练集群
...表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。120万片GPU是一个非常惊人的数字
2024-06-28 02:31:00
AI集群,对抗英伟达的新“杀手锏”?
...思考如何将数量庞大的GPU构建成一个更大规模的超大规模集群。近日,AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示
2024-06-28 11:38:00
近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步
2025-02-05 11:06:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai
Nvidia今天透露,已经收购了Run:ai,一家开发优化显卡集群性能软件的初创公司。此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称
2024-04-26 13:43:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...pic,宣布与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练
2024-12-05 09:47:00
大模型\\\
...GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小的开销,核心瓶颈竟然是一块“看不见的短板”:存储带宽
2025-04-08 17:41:00
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算
2024-06-27 19:01:00
微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本
...吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%
2023-06-27 22:15:00
更多关于科技的资讯:
两会,就这Young!丨万亿存量市场怎么激活?全国人大代表郭兴田用“两天”作答
编者按:今年全国两会,大河网两位00后记者首次踏上两会征程,以“萌新”视角记录两会,为网友带来全新体验:不背稿、不装样
2026-03-10 14:21:00
让家陪伴成长——金隅天坛家居Mall 3月7日启幕,定义“家生活”新方式
在快速更迭的时代,人们对家的期待已超越功能满足,转而追求情感承载与成长陪伴。正是基于这一洞察,金隅天坛家居Mall提出“我家的长期主义”核心主张——让家能够伴随家庭成长
2026-03-10 14:26:00
在教育选择中,高途网课是否靠谱、教育机构是否可靠、办学是否正规,是学习者和家长最为关注的核心问题。高途 2025 财年第四季度及全年财报
2026-03-10 14:27:00
文化认同融入创新表达,“欢笑中国年”如何抓住大众情绪的小切口?
2026 年春节,红包大战再度迎来内卷与爆发,随着AI平台扎堆涌入,用户在春节期间的注意力被分散、现金激励的边际效应减弱
2026-03-10 16:50:00
灵寿县:灵活就业AI分析让求职成功率提升25%
“把这次春风行动搜集到的信息尽快录入系统,用AI分析一下,精准做好匹配。”3月8日,灵寿县零工市场有关负责人张杉认真梳理了上一场“春风行动”收集到的用工求职信息
2026-03-10 11:30:00
杭州的人形机器人太超前 德国留学生专程为它来学习
近日,浙江科技大学机器人现代产业学院实验室里,来自德国德累斯顿技术经济大学的硕士研究生马克西米利安·穆勒正在开展关于宇树人形机器人的毕业论文研究
2026-03-10 11:36:00
大皖新闻讯 连日来,“养龙虾”成为一大热词。这里的龙虾不是水产,而是一款名为OpenClaw的开源AI智能体,因其图标是亮眼的红色龙虾
2026-03-10 13:41:00
新发路观察·两会特别报道|瞪羚样板背后的吉林创新力
今年全国两会上,瞪羚企业创新力再成热门话题。从数字经济到先进制造,从新材料到生物医药,一批又一批瞪羚企业脱颖而出……以创新破局
2026-03-10 13:46:00
当“移动蓝”邂逅“咖啡香”:中国移动江苏公司携手宜兴高职校,打造创业实践新样本
近日,位于宜兴人民南路139号的中国移动服务厅内,飘出了浓郁的咖啡香。备受关注的“电大咖啡”在这里正式开门迎客。这家由宜兴高等职业技术学校学生自主运营
2026-03-10 11:40:00
拥抱OpenClaw生态,途牛MCP开放平台正式上线
江南时报讯 3月9日,途牛对外发布正式上线MCP(Model Context Protocol)开放平台,面向AI Agent与个人助理(如OpenClaw)提供一站式旅游服务能力接口
2026-03-10 11:08:00
厦门网讯(厦门日报记者 林露虹)将智能马桶的外观调为柔和的粉色,以优化感官体验提升产品附加值;从个人护理细分赛道切入,构建服务女性的全品类矩阵……这些创新举措
2026-03-10 08:20:00
奋进的河北|共享智造 集群焕新
编者按安平丝网远销190多个国家和地区,肃宁乐器年产逾百万件……各具优势的县域特色产业,为燕赵大地高质量发展注入澎湃活力
2026-03-10 08:32:00
临海市人工智能创新发展大会日前举行,现场集中签约12个人工智能重点合作项目,涵盖智能制造等领域,标志着这座千年古城在竞逐人工智能新赛道上按下“加速键”
2026-03-10 08:33:00
3月7日上午,浙江代表团小组审议现场,全国人大代表、温州医科大学校长李校堃分享了一个数据:2025年我国创新药对外授权交易合同总金额超过1300亿美元
2026-03-10 08:34:00
近日,央视财经《银发经济走进城市|上海行》播出,聚焦上海在银发经济领域的创新实践。节目通过走访企业和行业代表,观察科技与服务模式如何满足老年群体日益增长的精神文化需求
2026-03-10 08:51:00