• 我的订阅
  • 科技

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

类别:科技 发布时间:2023-08-08 20:00:00 来源:砍柴网

随着2023年ChatGPT的概念不断升温,AI模型的参数规模呈现了指数级增长。云厂商面对的大模型客户也逐渐增多,并对存储系统以及整个IaaS层架构提出了巨大的挑战。

目前大模型的客户在存储系统的选型上可能会有以下几种选择:并行文件系统、基于对象存储的存储系统、NFS等。

首先我们看一下并行文件系统:

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

Density distribution plots of I/O activity from ML jobs using GPFS

《Characterizing Machine Learning I/O Workloads on Leadership Scale HPC Systems》中关于ML在GPFS中的IO模型示意图,可以看到在并行文件系统的传统科学计算领域IO模式,读写比例基本平衡且大部分为小IO,这种GPFS适用的IO模式是否能够完全匹配AI大模型下的场景呢?

这里引用Vast Data的数据,95%的AI Workloads是读密集型的,当然也有例外情况,比如大型语言模型的Checkpoint。并行文件系统在拥有高性能的同时,也引入了高复杂性,包括额外的客户端以及较高难度的维护工作,并行文件系统适用的HPC科学研究场景需要一个对存储系统代码和操作系统有深入了解的团队,这在科研实验室中是相对常见的,但对于商业企业来说,往往缺乏这种人员配置,在目前的大模型场景下,类似于GPFS的并行文件系统并不完全适用。

根据UCloud优刻得云平台上的客户IO模式来看,大模型计算的工作负载大部分场景下是读密集型的,并非大部分文件系统面对的读写比例平衡的场景,短时间的高读吞吐需求较为常见,高吞吐读之前会对文件进行大量列表操作等元数据操作,以及Checkpoint时期会有大量顺序写入,对于历史数据有一定的归档需求。

针对上述场景,目前UCloud优刻得提供全面优化升级的US3FS 2.0来满足大模型客户的存储需求。

US3FS是基于UCloud优刻得对象存储系统US3的文件系统,支持将对象存储中的Bucket直接以文件的形式挂载至客户端,方便客户业务通过文件的POSIX接口来访问数据,避免客户业务层面做过多的修改适配。面向大模型场景,目前UCloud优刻得对US3FS进行了升级优化,US3FS 2.0 整体架构如下:

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

从前述大模型的存储需求来看,后面将从高吞吐读需求,大量列表操作,大量顺序写入这三方面描述UCloud优刻得针对US3FS的优化升级过程。

这里首先考虑高吞吐读之前的大量列表的问题,整体分为两种解决思路:

1.打散后端US3的存储结构,旁路一套元数据系统进行元数据的性能优化等维护操作,不利用现有US3的元数据能力。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

2.不打散后端US3的存储结构,优化升级现有的US3元数据性能,并进行Meta Cache等近计算端优化。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

第一种方案理论上可以规避现有架构的历史负担,需要额外的硬件资源来提供元数据服务,改造后能够规避业务层面文件大小等因素对US3在高并发情况下发挥高吞吐能力的限制,也可以优化元数据结构以更贴近文件存储的树状方式,而不是对象存储的KV方式。但此方案整体改动较大,引入的风险也较多,且无法直接利用US3对象存储现有的增值服务,包括但不限于归档、低频等廉价存储的功能。

第二种方案需要对现有关系型数据库的老架构US3元数据进行升级,这里由于US3同时正在进行元数据UKV的升级过程,将US3整体的元数据迁移至KV的方式进行存取,可以直接利用数据,与此同时,还需要对现有的对象存储语义的ListObject进行一定优化来适配文件存储的场景,进而解决对象和文件之间元数据差异的问题。

经过对比,UCloud优刻得选择了第二种方案来实现US3FS2.0的元数据部分,依赖于UKV(UCloud优刻得自研的分布式KV存储系统)的整体存储计算分离的架构,可以支持0数据搬迁的Shard Split,快速进行列表请求计算部分的压力分摊,底层的统一存储层Manul也可以进行存储层面的压力分摊。

这里UCloud优刻得也会进行近端元数据的Cache,由于对象存储和文件存储存在天然的区别,对象存储的结构近似于KV的方式平铺,文件存储的方式近似于树状结构,客户在文件层面的readdir操作在极端情况下会导致底层KV层的大量seek操作效率不高,这里我们优化成直接进行平铺的ListObject操作并在近端进行整体的元数据重构以及Cache,保证客户的元数据检索效率,以在UCloud优刻得云平台实际上线的某客户为例,30PiB的数据元数据异步Cache的整体时间可控制在10分钟到20分钟级别。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

其次,UCloud优刻得还综合考虑了客户高并发读吞吐的需求,这里面向客户的业务实际场景,大模型通常是GiB级别的文件高并发的重复读取,UCloud优刻得并不希望这些重复的读取消耗后端对象存储的带宽。

UCloud优刻得在US3FS的挂载端通过本地NVMe来提供近计算端的分布式缓存,这里的缓存会利用计算节点间的东西向带宽,一般建议实际操作时,在计算网和存储网做网络层面的隔离,防止和计算部分的流量有干扰,UCloud优刻得也提供独立专有化部署的一整套解决方案。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

后续UCloud优刻得还会提供通过US3FS的管理节点US3FS Master来支持业务层主动提前Load指定的数据至缓存中的功能,但这需要将业务层和存储层做一些深度的结合才能实现。

在未进行预Cache时,上层应用从US3FS挂载点读取数据时,Kernel会将上层的读缓冲区拆分成固定大小传递给US3FS, 当US3FS接收到这些读请求时,会根据读的偏移,传入的缓冲区的大小以及设置的预读大小来确定实际要读的Range。默认情况下,US3FS以1MiB一个CachePage的形式组织文件的缓存区,通过读Range可以确定涉及的Pages,接着根据Page的状态(Ready, Missing or Infight), 如Pages全为Ready,则可直接向上返回,如存在Missing或者Inflight的Pages,则Missing的Pages需要向数据层发送GET_RANGE请求,Inflight的Pages需要等待对应的GET_RANGE执行完成,这里一定程度的耦合了大模型下客户顺序读的IO模型,通过参数能够最大优化在这种场景下的读取并发吞吐。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

接下来还需要对业务Checkpoint场景进行优化。由于业务的特殊性,写入Checkpoint期间计算训练是暂停的,写入速度的快慢就直接影响了客户整体的效率,又由于此时是大量顺序写,对存储系统的性能需求就明确为写吞吐。

这里也有两种解决思路:

3.写缓存,异步的上传到后端对象存储,保证当时写入的速度是近似于本地盘的速度。

4.提高并发,直接写至后端对象存储,由于后端整体的吞吐是可以支持平行扩展的,这里瓶颈如果能够打满挂载的网络则是最优的情况,那需要提高的就是写入的并发,降低整体吞吐对于写延迟的依赖。

综上UCloud优刻得选择了两者结合的方式。纯粹写缓存的方式在数据一致性以及系统复杂度上都有不少的麻烦,且能否解决问题强依赖于不可控的计算节点的缓存盘,而不是依赖于存储系统自身的环境。UCloud优刻得会在写入时将上层Kernel拆分下载为固定大小的IO进行进一步的合并整合,整合一个4MiB大小的Logic Block,用于后续并发上传至后端US3对象存储。上层的IO到达US3FS之后会直接返回成功,并逐步累积缓存对后端进行并发的分片上传,这里并发的大小以及缓存的度都是支持对参数随时配置修改的。

UCloud优刻得升级推出US3FS 2.0,面向大模型的存储系统改造

这样上层的串行IO通过US3FS后会变成高并发的分片上传请求到US3后端,进而提升整体的吞吐。

以上为一个实例集群US3FS Runtime的实时Stat功能展示的写吞吐,相较于优化前有50%左右的吞吐提升。

本文描述了面向大模型场景的存储需求,UCloud US3FS2.0 在元数据性能、读缓存、写吞吐三个方面的优化内容。在AI大模型的需求推动下,对整个存储系统以及IaaS计算、网络架构提出了较大的挑战。对于对象存储来说,前端的压力能够释放到后端之后,后续,UCloud优刻得还将在存储容量与性能需求不匹配、读缓存预热等方面持续进行优化。*图片来源由UCloud优刻得提供授权使用返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-08 21:45:58

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业
2023年,AI大模型的爆发成功引起连锁反应,头部厂商纷纷入局,推出自家的大模型。根据科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10
2023-07-27 11:42:00
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
AI时代,存储不仅是数据的栖息之地,更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中,众多厂商已将带宽等性能指标卷至新的高度。然而,这种追求似乎将AI这一复杂
2024-11-08 09:46:00
大模型\\\
新眸原创·作者|桑明强当全球科技巨头为AI大模型疯狂加码GPU算力时,一家头部券商公司却公开诉苦:费力搭建的GPU集群,利用率却始终卡在30%,算力空转导致每月仅电费就是一笔不小
2025-04-08 17:41:00
AI行业应用:数据编织助力AI应用训练突破
...人人都是产品经理《原创激励计划》出品。虽然现在AI大模型很火,每个企业都想分一杯羹,但是过程中涉及到的算法、数据等不是轻而易举就能实现的。其中,数据的传输和管理是个大问题。本
2023-06-08 09:00:00
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI
2024-12-19 18:16:00
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统
2024-06-16 10:27:00
...李生鹏)近日,酒钢医院成功完成PACS影像存储系统升级改造工作,升级后的影像存储系统使医生调阅各类影像的时间平均缩短170%,进一步提升了医院的诊断、治疗效率。据了解,酒钢医
2023-09-15 00:18:00
四步走,国产虚拟化替代不用愁!青云科技为企业IT管理人员支招
...求在制定替代方案时,企业 IT 管理人员首先需要明确其改造目标。在此过程中,需要重点关注以下核心需求,可供各位企业 IT 管理人员参考。一、有效支撑业务的运行确保虚拟化平台能
2023-06-07 23:00:00
阿里云AI基础设施获2024世界互联网大会领先科技奖
...重构了一个从底层硬件到计算、存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,成为国内最早自研、布局最深入的AI基础设施。目前,80%的中国科技公司、65%的专精特
2024-11-19 18:59:00
更多关于科技的资讯:
余杭文化“新三样”扬帆 驶向全球文化蓝海
《长安三万里·梦回大唐》获金鸡虚拟现实电影季“年度最佳艺术表现奖”。后亚运时代,杭州如何将因赛会集聚的国际目光,转化为持续的城市发展动能
2026-02-16 11:33:00
北京亦庄与它石智航达成战略合作!共建产业新高地
2026年伊始,具身智能产业持续加速发展。2月14日,北京亦庄与它石智航达成战略合作,双方将在具身智能关键技术攻关、应用落地和产业生态建设方面展开合作
2026-02-16 08:21:00
厦门网讯(厦门日报记者 林露虹)马年春节假期,厦门科技企业的“电子年货”火热上线。在厦门过年,市民和游客可以请AI当导游
2026-02-16 08:40:00
自2025年夏季,京东、美团、阿里等数字平台企业相继开启围绕即时零售市场的激烈争夺。这场“闪购大战”,初期以各方投入“天价补贴”争抢流量而引发社会广泛关注
2026-02-16 08:53:00
马年新春,光景别样。打开手机AI小程序,输入姓名、爱好与新年心愿,一键可生成专属春联。AI深度融入日常生活,无所不在。拥抱AI
2026-02-16 07:39:00
鲁网2月15日讯在人工智能加速重构产业组织形态的背景下,“一人即公司”(OPC)正成为全球创新创业的新范式。2026年2月12日
2026-02-15 20:48:00
石家庄市栾城区妇联举办美妆技能培训
河北新闻网讯(王秀平、李明发)近日,石家庄市栾城区妇联联合妆颜美化妆培训学校,精心举办了一场干货满满的美妆技能培训活动
2026-02-15 19:16:00
英科医疗开年首展登录迪拜WHX展会,“中国智造”医疗解决方案亮相全球市场
2月9日至12日,全球领先的医疗护理产品供应商英科医疗携三大事业部创新成果亮相阿拉伯国际医疗器械展览会(World Health Expo Dubai)
2026-02-15 13:50:00
龙岗文旅数字IP城市巡礼破圈传播,迎春花市成内容热点
市民围观、拍照打卡,数字人引爆春节花市春节前夕,龙岗迎春花市迎来一场特别的巡礼:数字IP首次在花市与市民面对面互动。现场
2026-02-15 13:52:00
近日,中亦科技收到了一封来自大众汽车的感谢信。信中对中亦科技服务团队在应对大规模生产系统突发故障时的卓越表现,以及长期以来展现出的专业素养和“以客户为中心”的担当精神给予了高度评价
2026-02-15 10:23:00
杭产数字人“席卷”东南亚
“这款粉底色号非常自然,贴合亚洲人肤色。” 马来西亚TikTok直播间,一位妆容精致的主播正微笑着与观众互动,当用户追问具体颜色
2026-02-15 07:41:00
《视野》杂志启动AI协作创作大赛
中国青年报客户端讯(中青报·中青网记者 马富春)2月13日,《视野》杂志“人类文明备忘录”AI协作创作大赛正式启动。活动以直播+实时互动形式展开
2026-02-14 20:52:00
新春走基层丨76秒,一套汽车零部件焊接就能下线
见习记者 朱荣琛2月12日,农历腊月廿五。春节临近,廊坊经开区道路两旁挂上了大红灯笼,沿街企业的大门已贴上了大对联。热热闹闹的年味儿在这个城市的大街小巷悄然弥漫
2026-02-14 22:12:00
针对春节期间服务需求,中国银行隆尧支行近日聚焦自助服务渠道,启动了专项保障工作。针对县域网点分布广、运维半径长的特点,隆尧支行依托历史运行数据
2026-02-14 22:17:00