• 我的订阅
  • 科技

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

类别:科技 发布时间:2023-07-27 11:42:00 来源:卓越科技

2023年,AI大模型的爆发成功引起连锁反应,头部厂商纷纷入局,推出自家的大模型。根据科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,“百模齐放”近在眼前。

来到大模型时代,AI不仅加速赋能千行百业,更对IT基础设施提出了新诉求。比如算力升级,调研机构TrendForce将2023年AI服务器预计出货量增幅调升超过1倍。为了加强算力,有更适合AI的GPU、加速器持续更新,数据中心与算力网络构建也在快速推进。但值得关注的是,面对AI大模型中更复杂的数据归集、预处理、训练、推理等过程,存力也迫切需要优化升级,避免数据存储成为系统瓶颈和算力资源闲置、浪费等局面。

“大模型时代,数据决定AI智能的高度。作为数据的载体,数据存储成为AI大模型的关键基础设施。”在7月14日举办的大模型时代华为AI存储新品发布会上,华为数据存储产品线总裁周跃峰这样说道。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

华为苏黎士研究所数据存储首席科学家张霁在分享中也提到,AI大模型与此前火热的深度学习相比,除模型自身的部分变化外,最大的特点就是数据量变得更大,也更加重要。高质量数据在很大程度上决定了AI模型的上限,算法和算力只是去无限逼近这个上限。

华为认为当前企业在开发及实施大模型应用过程中将面临四大挑战:

首先,数据准备时间长,数据来源分散,归集慢。周跃峰提到,百TB级的数据预处理需要10天左右时间,十分不利于整个系统高效运作。

其次,多模态大模型以海量文本、图片为训练集,数据量可能达到千亿、万亿参数级,对于系统小文件读写能力的需求相当严苛,但当前海量小文件的加载速度不足100MB/s,训练集加载效率低。

第三,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,需要Checkpoint机制恢复训练,故障恢复耗时超过一天。

第四,大模型实施门槛高,系统搭建繁杂,维护成本高,资源调度难,GPU资源利用率通常不到40%。

为了解决这些挑战,突破数据存力瓶颈,华为针对不同行业、场景大模型应用诉求推出了两款存储新品——OceanStorA310深度学习数据湖存储与FusionCubeA3000训/推超融合一体机。

全球性能密度最高的存储:OceanStorA310

OceanStorA310提供5U96盘位,带宽可以达到400G/s和1200万IOPS。OceanStorA310具备出色的可扩展性,最高支持4096个节点横向扩展,还有极高密度性能,每U带宽可以达到80G,是业界标准的1.6倍,并拥有240万IOPS。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

周跃峰介绍到,OceanStorA310是“为智能数据而生”,可以实现从数据归集、预处理到模型训练、推理的整体存储支撑。重点来了,除了卓越的性能,这款深度学习数据湖存储还支持存内计算。

OceanStorA310内置全局文件系统GFS具备智能数据编制能力,可以接入AI大模型分散的原始数据、实现跨系统、跨地域、跨多云的全局统一数据视图和调度,简化数据的归集流程。同时,OceanStorA310基于近存计算还可以通过内嵌的算力实现数据的预处理,避免数据的无效搬移,也降低处理服务器等待时间,预处理效率可以提升至少30%以上。

降低AI大模型部署门槛——FusionCubeA3000训/推超融合一体机

尽管已经“百模齐放”,但AI大模型落地到不同企业、场景中仍旧存在很高的门槛,无论是来自数据准备、数据断点续接等难题,还是系统构建部署,都成为更多企业进军大模型的拦路虎。

为了降低实施AI大模型门槛,解决这个复杂数据系统中来自工程、集成、运维等方方面面的难题,华为推出了FusionCubeA3000训/推超融合一体机。周跃峰表示,华为希望通过训/推超融合一体机等解决方案助力AI普惠,不仅是头部企业、大厂能够使用的先进更具,更是具备普适性的工具。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

FusionCubeA3000集成OceanStorA300高性能AI存储节点(支持50GB/s带宽、180万IOPS)、训/推节点、交换设备、AI平台软件与管理运维软件。不仅能够支持百亿级参数规模的模型,针对通用大模型、行业模型、中小规模模型等多样性行业及场景需求,可以通过水平扩展来完成适配。FusionCubeA3000在硬件层面具备算力、存力、运力,同时还有管理及虚拟化容器等软件支持,为大模型伙伴提供拎包入住式的部署体验,实现一站式交付。做到开箱即用,2小时内即可完成部署;支持5秒故障监测、5分钟故障恢复。

FusionCubeA3000的亮点不仅在于高性能、高集成、可扩展性,还可以提升算力资源的利用效率。通过高性能容器软件,FusionCubeA3000可以实现CPU、GPU资源池化共享。面对多场景训练、推理应用,或者模型调优、大小模型融合调度等业务需求,通过容器实现资源共享,将资源利用率从40%提升至70%以上。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

除此之外,FusionCubeA3000提供两种商业模式选择,更符合不同企业多样性需求,实现灵活部署,敏捷高效。一种是全国产化昇腾一站式方案,集成自研存储、网络、昇腾计算与管理运维软件。另一种模式为开放计算、网络、AI平台软件的第三方伙伴一站式方案。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

写在最后

在复杂的AI大模型系统中,任何一个环节出现短板都可能成为瓶颈。周跃峰提到,在AI大模型整个生命周期中,从投入成本来看,存储的比重在增加,不仅是因为数据量变大导致数据存储、处理越发重要,更是因为AI大模型系统中对于数据处理更加复杂,在此过程中对于性能要求更高。

华为分布式存储领域副总裁韩振兴也表示,在AI大模型领域,堆叠算力并不一定能提升性能,甚至可能由于存力无法满足数据归集、预处理、训练/推理等高性能需求,而导致算力等待,资源限制。未来,在建设系统时一定会更加重视最佳的整体算存比。

突破瓶颈!华为两大AI存储新品推进AI赋能千行百业

华为发力AI存储可挖掘的市场以及突破的瓶颈不仅是大模型,大模型只是AI赋能千行百业的的冰山一角。有数据显示,2023年上班年AI领域月均融资打到48起,设计自然语言处理、计算机视觉、机器人、集成电路、自动驾驶等众多领域。不难预料,作为先进工具的AI大模型可以加快AI渗透到更多领域,这也必然会进一步要求底层IT基础设施,特别是算力、存储等关键基础设施的升级创新。

对于华为及其合作伙伴而言,这是巨大的机遇。目前来看,华为在AI存储领域的布局早已展开,本次亮相的产品也是华为筹备多年的成果。同时在洞察市场趋势及布局未来方面,华为存储也有所行动,包括助力企业更加高效的实施AI大模型,提升大模型训练效率以及更受关注的数据安全等领域。例如围绕数据安全流转挑战,张霁提到华为正在研究称为“数据方舱”的技术。他表示,在流转的过程中,数据及其访问权限、凭证信息都被封装在一起,而数据到达归集地后,将在“数据方舱”安全执行环境中被安全地使用,从而保证数据的安全访问。

未来华为存储也将持续创新,周跃峰表示:“面向AI大模型时代提供多样化的方案与产品,携手伙伴共同推进AI赋能千行百业。”

举报/反馈

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-27 14:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

超越传统融合,华为计算型存储如何引领超融合+创新?
...需要持续进化,以满足分支边缘应用的不同需求。近日,在华为“超融合+”战略暨新品发布会上,华为闪存存储领域副总裁徐育林发表《计算型存储持续进化,实现生态+,体验+,商业+》主题
2023-02-16 18:00:00
...员王亚彪说,AI驱动科学研究,将突破传统科学研究能力瓶颈。强底座共筑安全算力基础设施走进上海自贸试验区临港新片区,一排排闪烁着灯光的机柜不眠不休,正是商汤人工智能大装置为大模
2024-01-12 11:25:00
华为光领域创新产品齐亮相“中国光谷”,助力行业智能化
...华网在2024中国光谷·光电子信息产业创新发展大会期间,华为在F5G智简全光网展区,围绕智能化时代“光进铜退、光进电退、光进人退”等三大光产业新趋势,全面展示全光园区、行业光
2024-05-17 13:38:00
新品上市|华为智选 海雀发布旗舰机皇,赢领家用摄像头行业市场
华为智选海雀在家用摄像头领域的长期布局战略已崭露头角,8月14日预售发布新款旗舰机皇产品,突破行业天花板,加速推动家用智能摄像头的行业发展。2023年8月14日,华为智选 海雀摄
2023-08-14 11:00:00
华为折叠屏手机新品电池技术大升级:容量突破5000mAh
今日消息,博主数码闲聊站透露,华为折叠屏手机电池升级,采用了高硅负极材料,电池容量达到了5060mAh(典型值),这款新品可能是华为MateX3。众所周知,折叠屏手机拥有更大的屏
2023-03-13 12:26:00
大模型深挖数据要素价值:算法、算力之后,存储载体价值凸显
...的存储,同样值得大模型领域从业者关注。在刚刚举办的华为全联接大会2023(HC 2023)上,华为方面系统介绍了其存储解决方案如何解决大模型训练与应用痛点、支撑大模型创新进程
2023-09-27 16:16:00
助力千百业发展新质生产力,华为擎云有何独到之处?
...,赋能千行百业深化变革。2024数博会聚焦高质量发展,华为擎云中国行赋能千百业围绕科技创新、数字经济高质量发展等热门话题,2024数博会8月28日至30日在贵州贵阳召开。作为
2024-08-30 10:12:00
AI大模型开发会被卡脖子吗? 华为盘古3.0发布会现场回应
凤凰网科技讯 7月7日消息,2023华为云开发者今日召开。华为常务董事、华为云CEO 张平安发表主题为《AI重塑千行百业》的开场演讲。华为华为盘古3.0大模型正式发布。张平安在演
2023-07-07 16:32:00
CFMS江波龙访谈:聚焦行业应用 新品落地展示创新实力
...而自研主控芯片等核心技术的演进就是为了突破原有性能瓶颈,更好满足用户高速连拍、高品质录制以及高效后期的需求。而在行业层面,容量高达1TB的NM卡借助更好的用户体验,对ITMA
2024-04-04 15:01:00
更多关于科技的资讯: