• 我的订阅
  • 科技

AMD将构建全球最大AI训练集群,集成120万片GPU

类别:科技 发布时间:2024-06-27 14:09:00 来源:芯智讯
AMD将构建全球最大AI训练集群,集成120万片GPU

6月26日消息,据The Next Platform报道,近日AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。

120万片GPU 是一个非常惊人的数字,要知道目前全球最强的超级计算机Frontier 所配备的 GPU 数量才只有37888片,这也意味着AMD所支持的AI训练集群的GPU规模将达到Frontier的30多倍。不过,Forrest Norrod没有透露哪个组织正在考虑构建这种规模的AI系统,但确实提到“非常清醒的人”正在考虑在AI训练集群上花费数百亿到数千亿美元。

目前的AI训练集群通常由几千个 GPU 构建而成,这些 GPU 通过跨多个服务器机架或更少的高速互连连接。如果要创建一个拥有高达 120 万个 GPU 的单体 AI 集群,意味着将会面临极为复杂的高速互连网络,并且还会有延迟、功耗、硬件故障等诸多的问题,这似乎是难以实现的。

比如,AI工作负载对延迟非常敏感,尤其是尾部延迟和异常值,其中某些数据传输比其他数据传输花费的时间要长得多,并且会中断工作负载。此外,当今的超级计算机也会面临每隔几个小时就会发生的 GPU 或其他硬件故障。当扩展到当今最大的超级计算机集群的 30 倍时。更为关键的是,如此庞大的AI训练集群,将会产生极为庞大的能耗,不仅稳定的供电将会是一个大难题,而且配套的散热解决方案也面临巨大挑战。

编辑:芯智讯-浪客剑

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 18:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

amd助力构建全球最大单体人工智能训练集群
...表示,AMD将助力构建全球最大的单体人工智能(AI)训练集群,将集成高达120万片的GPU。120万片GPU是一个非常惊人的数字
2024-06-28 02:31:00
AI集群,对抗英伟达的新“杀手锏”?
...思考如何将数量庞大的GPU构建成一个更大规模的超大规模集群。近日,AMD执行副总裁兼数据中心解决方案集团总经理Forrest Norrod在接受采访时表示
2024-06-28 11:38:00
近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步
2025-02-05 11:06:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...伟达及支持公司于当地时间凌晨4时20分开始在孟菲斯超级集群上进行训练。据他介绍,该集群在单个RDMA fabric上使用10万张液冷H100
2024-07-24 14:02:00
Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai
Nvidia今天透露,已经收购了Run:ai,一家开发优化显卡集群性能软件的初创公司。此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称
2024-04-26 13:43:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...pic,宣布与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练
2024-12-05 09:47:00
大模型\\\
...GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小的开销,核心瓶颈竟然是一块“看不见的短板”:存储带宽
2025-04-08 17:41:00
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算
2024-06-27 19:01:00
微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本
...吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%
2023-06-27 22:15:00
更多关于科技的资讯:
脑机接口、AI大模型……这个黑科技产业园点亮残疾人“无碍”生活
大河网讯 近日,首款侵入式脑机接口医疗器械正式获批上市,标志着脑机接口产业从“规划蓝图”正式驶入“快车道”。在脑机接口这条新兴赛道上
2026-04-07 17:19:00
87.6%职场人愿意投身新质生产力领域,高端装备与智能制造行业最受青睐
日前,智联招聘发布《2026春季职场人跳槽情况调查报告》,旨在深入解析在新形势、新产业、新技术驱动下,职场人的跳槽意愿
2026-04-07 17:26:00
150℃自动固化!我国钠离子电池取得重大突破
4月6日,中国科学院物理研究所胡勇胜团队在《自然·能源》发表重磅成果:该团队成功开发出一种具有自保护功能的可聚合不燃电解质(PNE)
2026-04-07 17:34:00
高舜礼:旅游演艺开发,还可入场吗?(图)
旅游演艺是目的地专供游客观赏的文艺演出,属旅游传统要素的“娱乐”。起初它只是为丰富夜间生活的娱乐活动,后陆续发展为一类旅游业态
2026-04-07 17:36:00
不止于赛!2026京津冀(廊坊)算力算法大赛来啦!
河北新闻网讯(侯博炎)为深入实施“人工智能+”行动,发挥廊坊算力优势,打造人工智能产业聚集区,构建人工智能创新要素融通
2026-04-07 17:41:00
【宅男财经|专家面对面】4月6日,产业链消息称富士康正在试产苹果首款折叠屏手机;折叠屏发展多年,苹果如今正式入局这只“靴子”就快要落地了
2026-04-07 18:57:00
科学周刊|科幻穿戴走进现实:比头发还细的“神奇纤维” 能连身体、通外界记者专访西安电子科技大学杭州研究院副教授周赟磊
一根直径仅50微米的纤维,比头发丝还细,却能实现了信号传输、传感感知、能量传输等多种功能。它柔软如丝,可弯曲编织,既能织入衣物监测心率
2026-04-07 19:22:00
中新经纬4月7日电 (谢婧雯)算力也要有“超市”和“银行”了。近日,工业和信息化部发布通知,开展普惠算力赋能中小企业发展专项行动
2026-04-07 19:50:00
廊坊首家OPC社区落户开发区 打造一站式轻资产创业平台
河北新闻网讯(陈哲、张超)3月27日,人民网828企业服务平台·京津冀数字人才港OPC社区正式成立并落户廊坊人力资源服务产业园
2026-04-07 17:54:00
近日,由平安科技联合哈尔滨工业大学(深圳)、北京大学共同完成的《复杂场景非完全信息高效智能决策关键技术及应用》项目,荣获2025年度吴文俊人工智能科技进步奖一等奖
2026-04-07 17:42:00
在全民终身学习不断深化的背景下,学习正从阶段性行为,逐步转变为贯穿个体生命周期的持续性实践。在这一过程中,包括梨花教育在内的全民终身学习新基建企业
2026-04-07 14:38:00
春潮涌动,耕织正忙。眼下正值春耕生产的关键时节,在临沂,一批搭载新能源混动技术的智能农机即将陆续下地。这背后,离不开一笔刚刚到位的金融支持
2026-04-07 15:38:00
江苏靖江:科技赋能物流 首批无人送货车正式投入运营
“自动驾驶中,请保持两米安全车距……”3 月中下旬,靖江市邮政分公司首批九识无人车 Z5 成功取得上路资质,成为靖江首批合规运营的无人送货车
2026-04-07 15:46:00
dynabook深圳工业展完美收官,XR智能眼镜+智能解决方案助力新质生产力发展
2026年3月31日 -4月3日,第二十七届深圳国际工业制造技术及设备展览会在深圳国际会展中心圆满落幕。玳能科技(杭州)有限公司以“玳领时代
2026-04-07 16:54:00
中新经纬4月7日电 7日早间,微信号“国家安全部”发文称,随着词元(Token)爆火,一些不法分子开始打起词元的主意,伺机布设各种陷阱
2026-04-07 11:57:00