• 我的订阅
  • 科技

AMD将构建全球最大AI训练集群,集成120万片GPU

类别:科技 发布时间:2024-06-27 14:09:00 来源:芯智讯
AMD将构建全球最大AI训练集群,集成120万片GPU

6月26日消息,据The Next Platform报道,近日AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。

120万片GPU 是一个非常惊人的数字,要知道目前全球最强的超级计算机Frontier 所配备的 GPU 数量才只有37888片,这也意味着AMD所支持的AI训练集群的GPU规模将达到Frontier的30多倍。不过,Forrest Norrod没有透露哪个组织正在考虑构建这种规模的AI系统,但确实提到“非常清醒的人”正在考虑在AI训练集群上花费数百亿到数千亿美元。

目前的AI训练集群通常由几千个 GPU 构建而成,这些 GPU 通过跨多个服务器机架或更少的高速互连连接。如果要创建一个拥有高达 120 万个 GPU 的单体 AI 集群,意味着将会面临极为复杂的高速互连网络,并且还会有延迟、功耗、硬件故障等诸多的问题,这似乎是难以实现的。

比如,AI工作负载对延迟非常敏感,尤其是尾部延迟和异常值,其中某些数据传输比其他数据传输花费的时间要长得多,并且会中断工作负载。此外,当今的超级计算机也会面临每隔几个小时就会发生的 GPU 或其他硬件故障。当扩展到当今最大的超级计算机集群的 30 倍时。更为关键的是,如此庞大的AI训练集群,将会产生极为庞大的能耗,不仅稳定的供电将会是一个大难题,而且配套的散热解决方案也面临巨大挑战。

编辑:芯智讯-浪客剑

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 18:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

amd助力构建全球最大单体人工智能训练集群
...表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。120万片GPU是一个非常惊人的数字
2024-06-28 02:31:00
AI集群,对抗英伟达的新“杀手锏”?
...思考如何将数量庞大的GPU构建成一个更大规模的超大规模集群。近日,AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示
2024-06-28 11:38:00
近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步
2025-02-05 11:06:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai
Nvidia今天透露,已经收购了Run:ai,一家开发优化显卡集群性能软件的初创公司。此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称
2024-04-26 13:43:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...pic,宣布与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练
2024-12-05 09:47:00
大模型\\\
...GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小的开销,核心瓶颈竟然是一块“看不见的短板”:存储带宽
2025-04-08 17:41:00
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算
2024-06-27 19:01:00
微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本
...吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%
2023-06-27 22:15:00
更多关于科技的资讯:
海工核心装备自主化取得新突破全国首台(套)船用SCV模块化装置成功交付南报网讯(通讯员张正平记者张希)近日,由江宁高新区企业中圣科技集团旗下中圣高科公司自主研发的全国首台(套)应
2025-11-05 08:17:00
□南京日报/紫金山新闻记者余梦娇通讯员彭蓉10月31日,在“向栖霞·享未来”2025年栖霞区秋季引才校园行南京财经大学站专场招聘会上
2025-11-05 09:56:00
智艺共生:AI赋能传播设计研究生作品展开幕
展览开幕历经三十余载积淀与发展,中国传媒大学广告与品牌学院以教学、科研与创意实践的融合创新,持续引领设计教育的前沿进程
2025-11-05 10:56:00
大皖新闻讯 11月5日,威马汽车在其官方微信号发布消息称,“我们很高兴地宣布,小威随行APP于2025年11月5日重新上线iOS和Android平台
2025-11-05 11:00:00
钉钉AI表格支持千万热行,超复杂实时计算真实可用
11月5日,钉钉AI表格宣布成为业内首个单表容量支持1000万热行的智能表格,目前已率先应用于“老字号”餐饮德香苑烤鸭等多家连锁零售
2025-11-05 11:23:00
沂南农商银行:助力科技企业打造新领域标杆
鲁网11月5日讯一根摩丝仅比头发丝略粗一点,但中间却是空的,这款膜组件直径36毫米,里面装了2000多根摩丝,直径最大的膜组件超过600毫米
2025-11-05 11:44:00
科技为骨,情感为魂:米连科技如何用温度重塑品牌连接
在竞争激烈的市场中,技术和服务是骨架,而品牌情感则是血肉。米连科技的过人之处,在于它成功地将“帮助用户获得爱与归属感”这一企业使命
2025-11-05 13:58:00
2025留学机构推荐:高口碑中介综合评测
在当前全球教育交流日益频繁的趋势下,越来越多的学生选择出国深造,出国留学中介机构因此承担起连接国内外教育资源的重要角色
2025-11-05 11:09:00
在线许愿,“听劝”的Leader统帅成了年轻人最想@的家电品牌
一条评论区里的留言,一次产品论坛里的建议,甚至是一段短视频下的“许愿”……这些散落在互联网角落的零散声音,正被统帅仔细收集起来
2025-11-05 11:07:00
即将开幕!首届WCE世界营地博览会,一篇理清所有重点!
想对话全球营地大佬?想抄浙江标杆营地的实战作业?想一站式对接国际资源与供应链?2025年11月7-9日,首届WCE世界营地博览会将在“两山理论”发源地浙江安吉重磅启幕
2025-11-05 08:25:00
近日,太重集团自主研制的国内最大1100吨直臂架门座式起重机,历经海上运输的平稳旅程,顺利抵达用户现场,设备总装工作正式拉开帷幕
2025-11-05 08:30:00
科赴与美团医药健康升级战略合作 为消费者构建更加多元化、便捷的健康解决方案
2025年11月4日,上海 – 今日,在美团北京总部,科赴中国与美团医药健康宣布升级战略合作,双方将在多年合作的基础上
2025-11-05 08:55:00
绘喵教育八周年庆典圆满落幕:以热爱为笔,绘就艺术教育新蓝图
近日,绘喵教育以“无限热爱・无限可能”为主题的八周年庆典活动圆满举行。活动通过“线上直播+线下盛典”双线联动的形式,共同回顾八年深耕插画教育的成长足迹
2025-11-05 10:26:00
“AI+医疗”活力迸发!温州全力打造医学人工智能高地
温州居民李阿姨通过AI助手解读的体检报告;医院放射科利用“AI+云影像”,五分钟就能初筛CT片;糖尿病患者张大伯通过可穿戴设备传输数据
2025-11-05 10:46:00
校宝App荣获“2025榜样教育产品奖”,以持续创新引领教育服务数字化进程
2025年10月21日,2025校长邦T教育创新大会暨“中关村·智聚”教育创新论坛在北京隆重开幕。在大会的焦点环节“第十届榜样教育年度盛典”中
2025-11-05 08:25:00