• 我的订阅
  • 科技

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

类别:科技 发布时间:2023-08-08 20:00:00 来源:砍柴网

随着2023年ChatGPT的概念不断升温,AI模型的参数规模呈现了指数级增长。云厂商面对的大模型客户也逐渐增多,并对存储系统以及整个IaaS层架构提出了巨大的挑战。

目前大模型的客户在存储系统的选型上可能会有以下几种选择:并行文件系统、基于对象存储的存储系统、NFS等。

首先我们看一下并行文件系统:

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

Density distribution plots of I/O activity from ML jobs using GPFS

《Characterizing Machine Learning I/O Workloads on Leadership Scale HPC Systems》中关于ML在GPFS中的IO模型示意图,可以看到在并行文件系统的传统科学计算领域IO模式,读写比例基本平衡且大部分为小IO,这种GPFS适用的IO模式是否能够完全匹配AI大模型下的场景呢?

这里引用Vast Data的数据,95%的AI Workloads是读密集型的,当然也有例外情况,比如大型语言模型的Checkpoint。并行文件系统在拥有高性能的同时,也引入了高复杂性,包括额外的客户端以及较高难度的维护工作,并行文件系统适用的HPC科学研究场景需要一个对存储系统代码和操作系统有深入了解的团队,这在科研实验室中是相对常见的,但对于商业企业来说,往往缺乏这种人员配置,在目前的大模型场景下,类似于GPFS的并行文件系统并不完全适用。

根据UCloud优刻得云平台上的客户IO模式来看,大模型计算的工作负载大部分场景下是读密集型的,并非大部分文件系统面对的读写比例平衡的场景,短时间的高读吞吐需求较为常见,高吞吐读之前会对文件进行大量列表操作等元数据操作,以及Checkpoint时期会有大量顺序写入,对于历史数据有一定的归档需求。

针对上述场景,目前UCloud优刻得提供全面优化升级的US3FS 2.0来满足大模型客户的存储需求。

US3FS是基于UCloud优刻得对象存储系统US3的文件系统,支持将对象存储中的Bucket直接以文件的形式挂载至客户端,方便客户业务通过文件的POSIX接口来访问数据,避免客户业务层面做过多的修改适配。面向大模型场景,目前UCloud优刻得对US3FS进行了升级优化,US3FS 2.0 整体架构如下:

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

从前述大模型的存储需求来看,后面将从高吞吐读需求,大量列表操作,大量顺序写入这三方面描述UCloud优刻得针对US3FS的优化升级过程。

这里首先考虑高吞吐读之前的大量列表的问题,整体分为两种解决思路:

1.打散后端US3的存储结构,旁路一套元数据系统进行元数据的性能优化等维护操作,不利用现有US3的元数据能力。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

2.不打散后端US3的存储结构,优化升级现有的US3元数据性能,并进行Meta Cache等近计算端优化。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

第一种方案理论上可以规避现有架构的历史负担,需要额外的硬件资源来提供元数据服务,改造后能够规避业务层面文件大小等因素对US3在高并发情况下发挥高吞吐能力的限制,也可以优化元数据结构以更贴近文件存储的树状方式,而不是对象存储的KV方式。但此方案整体改动较大,引入的风险也较多,且无法直接利用US3对象存储现有的增值服务,包括但不限于归档、低频等廉价存储的功能。

第二种方案需要对现有关系型数据库的老架构US3元数据进行升级,这里由于US3同时正在进行元数据UKV的升级过程,将US3整体的元数据迁移至KV的方式进行存取,可以直接利用数据,与此同时,还需要对现有的对象存储语义的ListObject进行一定优化来适配文件存储的场景,进而解决对象和文件之间元数据差异的问题。

经过对比,UCloud优刻得选择了第二种方案来实现US3FS2.0的元数据部分,依赖于UKV(UCloud优刻得自研的分布式KV存储系统)的整体存储计算分离的架构,可以支持0数据搬迁的Shard Split,快速进行列表请求计算部分的压力分摊,底层的统一存储层Manul也可以进行存储层面的压力分摊。

这里UCloud优刻得也会进行近端元数据的Cache,由于对象存储和文件存储存在天然的区别,对象存储的结构近似于KV的方式平铺,文件存储的方式近似于树状结构,客户在文件层面的readdir操作在极端情况下会导致底层KV层的大量seek操作效率不高,这里我们优化成直接进行平铺的ListObject操作并在近端进行整体的元数据重构以及Cache,保证客户的元数据检索效率,以在UCloud优刻得云平台实际上线的某客户为例,30PiB的数据元数据异步Cache的整体时间可控制在10分钟到20分钟级别。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

其次,UCloud优刻得还综合考虑了客户高并发读吞吐的需求,这里面向客户的业务实际场景,大模型通常是GiB级别的文件高并发的重复读取,UCloud优刻得并不希望这些重复的读取消耗后端对象存储的带宽。

UCloud优刻得在US3FS的挂载端通过本地NVMe来提供近计算端的分布式缓存,这里的缓存会利用计算节点间的东西向带宽,一般建议实际操作时,在计算网和存储网做网络层面的隔离,防止和计算部分的流量有干扰,UCloud优刻得也提供独立专有化部署的一整套解决方案。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

后续UCloud优刻得还会提供通过US3FS的管理节点US3FS Master来支持业务层主动提前Load指定的数据至缓存中的功能,但这需要将业务层和存储层做一些深度的结合才能实现。

在未进行预Cache时,上层应用从US3FS挂载点读取数据时,Kernel会将上层的读缓冲区拆分成固定大小传递给US3FS, 当US3FS接收到这些读请求时,会根据读的偏移,传入的缓冲区的大小以及设置的预读大小来确定实际要读的Range。默认情况下,US3FS以1MiB一个CachePage的形式组织文件的缓存区,通过读Range可以确定涉及的Pages,接着根据Page的状态(Ready, Missing or Infight), 如Pages全为Ready,则可直接向上返回,如存在Missing或者Inflight的Pages,则Missing的Pages需要向数据层发送GET_RANGE请求,Inflight的Pages需要等待对应的GET_RANGE执行完成,这里一定程度的耦合了大模型下客户顺序读的IO模型,通过参数能够最大优化在这种场景下的读取并发吞吐。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

接下来还需要对业务Checkpoint场景进行优化。由于业务的特殊性,写入Checkpoint期间计算训练是暂停的,写入速度的快慢就直接影响了客户整体的效率,又由于此时是大量顺序写,对存储系统的性能需求就明确为写吞吐。

这里也有两种解决思路:

3.写缓存,异步的上传到后端对象存储,保证当时写入的速度是近似于本地盘的速度。

4.提高并发,直接写至后端对象存储,由于后端整体的吞吐是可以支持平行扩展的,这里瓶颈如果能够打满挂载的网络则是最优的情况,那需要提高的就是写入的并发,降低整体吞吐对于写延迟的依赖。

综上UCloud优刻得选择了两者结合的方式。纯粹写缓存的方式在数据一致性以及系统复杂度上都有不少的麻烦,且能否解决问题强依赖于不可控的计算节点的缓存盘,而不是依赖于存储系统自身的环境。UCloud优刻得会在写入时将上层Kernel拆分下载为固定大小的IO进行进一步的合并整合,整合一个4MiB大小的Logic Block,用于后续并发上传至后端US3对象存储。上层的IO到达US3FS之后会直接返回成功,并逐步累积缓存对后端进行并发的分片上传,这里并发的大小以及缓存的度都是支持对参数随时配置修改的。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

这样上层的串行IO通过US3FS后会变成高并发的分片上传请求到US3后端,进而提升整体的吞吐。

以上为一个实例集群US3FS Runtime的实时Stat功能展示的写吞吐,相较于优化前有50%左右的吞吐提升。

本文描述了面向大模型场景的存储需求,UCloud US3FS2.0 在元数据性能、读缓存、写吞吐三个方面的优化内容。在AI大模型的需求推动下,对整个存储系统以及IaaS计算、网络架构提出了较大的挑战。对于对象存储来说,前端的压力能够释放到后端之后,后续,UCloud优刻得还将在存储容量与性能需求不匹配、读缓存预热等方面持续进行优化。*图片来源由UCloud优刻得提供授权使用返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-08 21:45:58

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业
2023年,AI大模型的爆发成功引起连锁反应,头部厂商纷纷入局,推出自家的大模型。根据科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10
2023-07-27 11:42:00
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
AI时代,存储不仅是数据的栖息之地,更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中,众多厂商已将带宽等性能指标卷至新的高度。然而,这种追求似乎将AI这一复杂
2024-11-08 09:46:00
大模型\\\
新眸原创·作者|桑明强当全球科技巨头为AI大模型疯狂加码GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小
2025-04-08 17:41:00
AI行业应用:数据编织助力AI应用训练突破
...人人都是产品经理《原创激励计划》出品。虽然现在AI大模型很火,每个企业都想分一杯羹,但是过程中涉及到的算法、数据等不是轻而易举就能实现的。其中,数据的传输和管理是个大问题。本
2023-06-08 09:00:00
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI
2024-12-19 18:16:00
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统
2024-06-16 10:27:00
...李生鹏)近日,酒钢医院成功完成PACS影像存储系统升级改造工作,升级后的影像存储系统使医生调阅各类影像的时间平均缩短170%,进一步提升了医院的诊断、治疗效率。据了解,酒钢医
2023-09-15 00:18:00
四步走,国产虚拟化替代不用愁!青云科技为企业IT管理人员支招
...求在制定替代方案时,企业 IT 管理人员首先需要明确其改造目标。在此过程中,需要重点关注以下核心需求,可供各位企业 IT 管理人员参考。一、有效支撑业务的运行确保虚拟化平台能
2023-06-07 23:00:00
阿里云AI基础设施获2024世界互联网大会领先科技奖
...重构了一个从底层硬件到计算、存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,成为国内最早自研、布局最深入的AI基础设施。目前,80%的中国科技公司、65%的专精特
2024-11-19 18:59:00
更多关于科技的资讯:
廊坊推出算力券撬动人工智能产业每年投放总额不超过1000万元,已吸引23家初创企业落地河北日报讯(记者刘英、刘杰)“基于流程
2025-11-08 07:54:00
摘要:随着数字经济的深入发展,传统供应链金融暴露出信息不透明、业务流程复杂、风险管控难度大等突出问题,其数字化转型已成为当前行业发展的重要课题
2025-11-08 05:24:00
摘要:本文探讨数字化时代企业管理模式的创新路径,首先分析数字化对企业管理模式的核心影响,指出其推动管理对象向“人-财-物-数据”融合转变
2025-11-08 05:24:00
智推时代:用GEO打造品牌增长新引擎
在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道
2025-11-07 08:03:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》指出,截至2025年6月,国内生成式引擎月活用户已突破8
2025-11-07 08:05:00
一、旅游出行安全保险尚无权威排名,选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准,产品选择应重点考察保险公司服务能力(偿付能力充足率
2025-11-07 08:06:00
当生成式AI技术以迅猛势头重构搜索生态时,如何为企业精准挑选高度契合需求的GEO(生成式引擎优化)服务供应商,已成为抢占下一代流量入口的核心战略动作
2025-11-07 08:06:00
科学实力获市场验证:任我行液体钙获全球销量第一认证
2025年11月初,德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书
2025-11-07 08:07:00
磷虾油产品对比 磷虾油品牌深度测评与科学选购指南
近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后
2025-11-07 08:07:00
道路“会思考” 出行更美好!数字道路建设赋能未来之城
数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上,看似普通的路灯杆集合了多种智能设备,成为智慧交通的“眼睛”
2025-11-07 08:20:00
今年9月27日,雄安图书馆正式向公众开放。一个多月来,已迎来访客20余万人次。这座形如书卷徐徐展开的建筑,不仅是新区一座崭新的文化地标
2025-11-07 08:20:00
关注进博会丨河北再赴进博之约(二):把全球好物装进“购物车”
把全球好物装进“购物车”——河北再赴进博之约(二)11月6日,在第八届中国国际进口博览会河北省主题展区,河北参展商正在进行路演活动
2025-11-07 08:21:00
南报网讯(通讯员王亚洲朱丽纯记者王婷婷)日前,“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局
2025-11-07 08:23:00
今年以来,肥乡联社在省联社及邯郸审计中心的精准指导下,锚定代理保险业务作为中间业务增长的核心抓手,深挖县域保险市场潜力
2025-11-07 10:22:00
为全面提升金融服务安全性,切实保障广大客户的资金与信息安全,近期,行唐联社市仝信用社积极行动,开展了一系列网络安全宣传与防护活动
2025-11-07 10:24:00