• 我的订阅
  • 科技

华为AI存储助力中国移动构建超大规模智算集群

类别:科技 发布时间:2024-12-19 18:16:00 来源:人民资讯

本文转自:人民日报

《人民日报》(

2024年12月19日

第 18 版)

华为AI存储助力中国移动构建超大规模智算集群

大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量数据信息的投入。面对智算集群目前存在的可用度、推理体验等问题,华为推出业界首款AI存储——OceanStor A800,致力于成为支撑智算集群发展的关键基座。

智算集群为千行万业发展新质生产力夯基筑石

近年来,智能计算已经成为推动社会发展进步的重要力量。从计算机视觉到自然语言处理、多模态等基础大模型研究,再到面向自动驾驶、生命科学等重点行业的专用大模型研发,各行各业都展示出对智能算力的巨大需求。

中国移动抢抓数字经济发展新机遇,立足自身资源禀赋和能力优势,以算为中心、以网为根基、以存为引擎,打造多种信息技术深度融合、可提供一体化服务的算力网络,对内满足“九天”人工智能大模型训练,对外面向千行万业提供一站式智能计算服务,加快发展新质生产力。

借助智算集群提供的服务,运营商行业加速数智化转型,可汇聚数百万个基站、数亿用户以及数百PB级历史数据,实现L4级网络自动驾驶;金融行业可对信贷申请进行快速处理,时间从原来的数天缩短到一分钟,甚至最快一秒钟即可完成审批。

华为AI数据湖方案助力中国移动智算中心构建坚实底座

中国移动智算中心(哈尔滨)节点充分利用中国移动(哈尔滨)数据中心软硬件优势、自然冷源地域优势,提前4个月攻坚完成3千多平方米机房的供电、制冷、建筑结构等重大调整改造,涉及5000多台设备、7万多根线缆、20多万个端口、千万级精密器件的大规模集群复杂施工。在30多个单位、千余人的协同支持下,历经7个月时间,超万卡规模智算集群建成,存力规模达150PB。

在智能融合分级存储集群的设计初期,中国移动面临几大挑战:在吞吐性能方面,万亿级参数大模型需要至少10TB/秒的吞吐量,而传统存储系统难以满足这一要求;在多协议处理方面,数据从归集到处理再到训练,涉及对象存储和文件存储的频繁转换,这对传统存储架构是一个巨大挑战;在数据管理效率方面,随着数据的动态变化,热数据与冷数据需要按需流动,传统系统主要依赖人工干预,效率较低。

为应对上述挑战,华为为中国移动提供AI数据湖解决方案,构建智算中心数据底座,实现聚合带宽8TB/秒,IOPS(每秒读写次数)达2.3亿。受益于AI数据湖高可靠、高性能等特点,大幅降低集群故障概率,缩短了断点续训时间,使得90天单训练周期内GPU的等待时间从7天减少到2天。

在训练方面使智算集群实现从“堆算力”到“提效率”的转化

华为推出AI数据湖解决方案,基于OceanStor AI存储和OceanStor Pacific分布式存储的诸多技术创新,可支撑千亿/万亿级参数大模型高效训练与推理。

大模型训练系统对算力需求很大,计算密度空前,对数据吞吐量的要求也与时俱增,要求达到传统应用的数十倍甚至百倍。对于存储来说,首先就是要快速将数据源源不断地投入大模型。

为最大程度发挥每块算力卡的“潜力”,华为OceanStor A800首创数控分离架构,让数据从接口卡直接传输到存储介质,避免CPU和内存等潜在的瓶颈,大幅提升存储带宽和IOPS能力。在2024年MLPerf TM存储基准性能测试比拼中,OceanStor A800荣登榜首,其2节点性能高达679 GB/秒。

面对训练过程中的海量数据汇聚与高效存储问题,华为AI数据湖解决方案构建了全局文件系统、无损多协议互通、EB级扩展以及热温冷数据智能分级存储等能力,用一套存储实现AI各阶段数据的免拷贝和格式免转换,加速数据价值释放,并实现整体拥有成本(TCO)最优。

在推理方面使大模型实现从“快思考”到“慢思考”的转化

大模型产品具有即时问答的“快思考”能力,让AI变得更“聪明”,就要使其具备逻辑梳理、应对变化的“慢思考”能力。

使AI具备“慢思考”的能力,关键在于记录下AI推理过程中的每一次“思考”结果,使其再遇到相同的复杂问题时不需要重新计算。专门记录大模型思考结果的存储被称为“长记忆内存型存储”,作为内存的扩展,以分级的方式实现月级/年级的记忆能力,甚至是“终生”记忆能力。

华为OceanStor A800是业界首款提供“长记忆”能力的存储,通过“多级键—值缓存(KV—Cache)机制”将所有的思考结果持久化保存并高效使用,让大模型推理具备“慢思考”能力,以减少大模型在预填充阶段的重复计算。如此,客户进行AI推理的时延可降低近八成,单个计算卡的吞吐量提升约2/3,可在实现推理体验提升的同时降低成本。

如今,智算中心正从千卡集群向万卡甚至超万卡集群演进。华为将与中国移动等企业持续深入合作,一起应对超万卡集群建设和运营带来的前所未有的挑战,抓住人工智能发展的历史机遇,打造自主创新的智算中心可靠数据底座。

数据来源:中国移动通信集团黑龙江有限公司华为技术有限公司

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-19 21:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为、百度、阿里云等发起“大模型基础设施高质量发展行动计划”
...工信部人工智能关键技术和应用评测实验室、工商银行、中国移动、中国联通、百度、阿里云、腾讯云、蚂蚁集团等正式发起“大模型基础设施高质量发展行动计划”。IT之家从大会获悉,该计划
2024-11-13 14:10:00
...应用实践案例中,包括邮储银行、民生银行、兴业银行、中国移动、中国联通、京东、国网江苏电力、京东方等行业头部企业的核心业务创新实践,为推动产业技术创新、促进形成规模化应用起到了
2024-01-04 08:05:00
推进新型工业化的广东实践:大产业立柱架梁,新老赛道并进
...工信部“新型工业化媒体调研行”走进位于广州和东莞的华为终端、记忆存储、华星光电、文远知行等数十家企业。这些企业也勾勒出广东省在推进新型工业化方面的工作成效。8个万亿级产业集群
2024-12-03 10:52:00
华为大动作曝光,3万亿赛道沸腾!
数据是个宝数据宝炒股少烦恼华为传来一则大消息。12月25日,据国家广播电视总局官网消息,国家广播电视总局批复同意在华为技术有限公司设立“超高清技术创新与应用国家广播电视总局重点实
2023-12-26 14:35:00
要以计算集群的视角,来重新审视芯片!
...或许适用于某些产业,但在芯片领域,挑战格外巨大。 华为在手机CPU领域取得的成功,为国内技术界注入了巨大信心。他们的麒麟系列芯片不仅在国内市场取得了显著的份额,甚至在国际市
2023-10-24 18:08:00
不用买大内存手机了!小米NAS官宣,云端扩容手机
继华为之后,又一家手机厂商盯上了NAS行业。日前,小米生态链总经理陈波发视频称,小米针对NAS核心技术已经展开了几个月的预研,目标是打造最适合米家用户的家庭存储产品。尽管陈波并未
2024-11-04 22:03:00
为什么要将程序部署到云服务器上?华为云开年采购季Web及移动App上云体验
...复能力,从而保证了数据库服务的稳定性。可能会用到的华为云服务华为云提供上面多个服务,可以让用户轻松快捷的实现我们上面说的这个架构,帮助大家快速的在云上构建一个稳定性较强的业务
2023-03-15 12:00:00
华为张迪煊:共筑智能根基,引领AI新未来
7月6日,昇腾人工智能产业高峰论坛在上海举办。会上,华为昇腾计算业务总裁张迪煊发表《共筑智能根基,引领AI新未来》主题演讲,他表示:只有“基础打得牢、技术扎得深、生态更紧密”人工
2023-07-13 19:00:00
智绘·武职③丨迈向湖北光电产业集群“破冰”之路
...职业技术大学、广州番禺职业技术学院等职教标杆,以及华为技术有限公司、江西科骏实业有限公司、广州网易计算机系统有限公司等头部企业展开深入交流。6月11日下午,武汉职业技术大学与
2025-06-24 23:57:00
更多关于科技的资讯:
■ 胡蓉摘要:在数字经济快速发展的背景下,营销活动的数字化、智能化和平台化已成为企业提升市场竞争力的重要途径。相较于民营企业和互联网企业
2026-01-29 04:48:00
探店1天|“两个月投入8000元”,年轻人迷上花滑,啥情况?
中新经纬1月28日电 (李自曼)“重心往下,感觉你的刀刃!起身,张开双臂保持平衡……”在冰场中央,花滑教练王子誊一边说着
2026-01-28 23:33:00
江南时报讯 2025年,泰州农商银行秉持“以客户为中心”的理念,深入开展“运营服务满意年”专项活动,以创新驱动、网点提质
2026-01-28 21:53:00
山东移动日照分公司圆满完成2025年银行金融跨年结算通信保障工作
鲁网1月28日讯近日,日照移动公司全力组织人员保障网络工作,顺利完成市县银行系统52家网点的网络保驾护航工作,圆满完成网络通信保障
2026-01-28 22:01:00
科技赋能传统酿造 引领产业数智变革——中科恒信人工智能上甑机器人及发酵食品高端装备项目投产
鲁网1月28日讯近日,记者走进中科恒信智能科技(泰安)有限公司人工智能上甑机器人及发酵食品高端装备项目的智能装备车间,大族激光切割机精准作业
2026-01-28 17:21:00
第四届MUST Awards顺利举办,科技行业年终盛典收官
1月22日,第四届MUST Awards麻瓜青年选择奖在杭州成功举办。作为国内首个由科技内容创作者与大众消费者共同投票评选的消费科技奖项
2026-01-28 17:46:00
宇树科技官方:关于2025年销量数据的澄清
1月22日晚,宇树科技官方微信公众号发布了一份关于2025年销量数据的澄清。宇树强调,过去一个月,网上流传着很多关于宇树2025年出货数量的不实信息
2026-01-28 17:52:00
潮新闻与传播大脑发布“178”方案 打造主流媒体系统性变革的“浙江样本”
大皖新闻讯 1月28日,“三生万物 AI如潮涌”潮新闻&传播大脑三周年联合发布会在浙江杭州体育场路178号浙江日报报业集团举行
2026-01-28 17:54:00
遵义人的年味天花板来了!2026新春年货全网剧透,逛吃玩拿一站齐!
来源:遵义晚报一审:余旭二审:王信 姚腾三审:唐全寿
2026-01-28 18:05:00
中国消费者报北京讯(记者王小月)1月27日,中国连锁经营协会发布2025年度中国购物中心行业景气度报告。当前,购物中心经营仍面临诸多挑战
2026-01-28 18:10:00
2026中关村早期投资论坛暨AI新场景产业创新大会在京举行
1月28日,由中关村天使投资联盟、海创汇、北京前沿国际人工智能研究院、铅笔道、AC加速器联合主办的“2026中关村早期投资论坛暨AI新场景产业创新大会”在北京市海淀区中关村国家自主创新示范区展示中心成功举办
2026-01-28 18:15:00
中国蓝新闻讯 在宁波余姚,一批企业敏锐抓住全球冰雪运动热潮,通过科技创新与产品升级,积极开拓海外市场,让“中国智造”的体育用品走向世界
2026-01-28 18:23:00
中国蓝新闻综合 近日,宇树科技正式官宣成为中央广播电视总台2026年春晚机器人合作伙伴,这是其继2021年牛年春晚、2025年蛇年春晚后第三次登上这一国民级舞台
2026-01-28 18:23:00
河北新闻网讯(张纳军)近日,开滦股份吕家坨矿洗煤厂重介车间内,技术副厂长李小刚正忙于新系统的调试。该矿新引进的重介智能分选系统已进入关键安装调试阶段
2026-01-28 14:13:00
河北新闻网讯(张纳军)近年来,开滦股份吕家坨矿将信息基础建设作为矿井智能化发展的重要支点,系统推进大数据中心、一体化云平台
2026-01-28 14:14:00