• 我的订阅
  • 科技

大模型改变算力,新华三加码算力集群能力

类别:科技 发布时间:2023-06-21 17:00:00 来源:钛媒体APP
大模型改变算力,新华三加码算力集群能力

算力与应用的发展,是一个不断上升、循环往复的过程,每当算力提升到一个新高度,总是会催生新的应用,新应用出现又需要更高的算力来支持。大模型就是算力发展历史上的一个关键节点。

“大家可以把‘算力自由’想象成第二次工业革命,电气化时代,爱迪生发明灯泡是一个标志性时刻,但最关键的是谁能够把产品做出来,普惠大众。”新华三集团副总裁、计算存储产品线总裁徐润安表示。

大模型对算力的改变才刚刚开始,大模型将来会消耗多少算力,或者说产生大模型算力的方法会有多少种,现在都是未知数。

“我相信在不远的将来,整个算力市场都会带来新一轮的革命,不论是硬件还是软件,所有的目的都是为了源源不断地提供算力给AI,当然我也相信,AI也会创造出更多新的方法,提高算力使用的效率”,徐润安补充表示。

而目前,大模型对算力的改变已经有迹可循。

算力走向全局化

传统计算以集中式架构为主,一定程度上存在复杂、低效、僵化的问题,但随着分布式架构重塑算力形态,需要在扩展性、管理性、安全性等方面实现全面升级,并将向着高效、低碳、智能的方向加速发展。

新华三集团计算存储产品线副总裁刘宏程表示,“大模型到来之后,今天谈到的算力,更多是计算、存储、网络一体化解决方案的融合。我们从客户那了解到,只卖GPU不够,建立一个全方位的解决方案,需要把服务器、存储和网络综合形成一个整体解决方案,才能帮助用户建立大模型环境,最终落实到行业应用中。”

上游芯片厂商每一次的产品更新,都意味着下游服务器厂商需要重新做一次研发,例如英伟达GPU从Ampere架构更新到Hopper架构,新华三的服务器R5500 G5也随之更新到R5500 G6。

其中,除了GPU的变化,CPU也更新到下一代, PCle从过去的Gen4到Gen5,网络从过去的100G和200G为主,升级为200G和400G为主。此外,新的网络互联、xPU、DPU等技术也变得越来越成熟,这就要求服务器厂商有相对完善的储备。

服务器本身就是系统级工程,大模型的改变是将服务器集群视作整体,需要在更大范围做系统级别优化。

刘宏程介绍,“从我们现在看到的用户实践,客户要求无损网络,RDMA也好,RoCE也好,不能丢一个数据包。丢一个数据包,有可能前面几十个小时训练的数据要重算,用户算力的利用率会降到非常低的水平,我们见过客户因为调度不灵活,算力甚至只用了5%、10%,服务器就在那空转。”

“每跨一台服务器,性能就会有一定的削减,这个削减来源于服务器之间互联和数据之间的调度,比如存储数据怎么获得,两台不同的服务器之间网络带宽和延迟是多少,这些都是整个AIGC解决方案里面需要综合考虑的部分。”他说。

此外,高能耗也是大模型算力的一个客观限制,很多客户一个机柜里只放一台GPU服务器,甚至两个机柜放一台,就是因为能耗问题。根据ODCC的数据显示,2020年我国数据中心能耗总量为939亿千瓦时,碳排放量为6464万吨。预计到2030 年,能耗总量将达到3800亿千瓦时左右,碳排放增长率将超过 300%。如何做到绿色低碳,也是大模型算力的一个瓶颈。

“一体·两中枢”,新华三补短板

以云计算为代表的厂商,在大模型算力集群方面刷足了存在感,这就要求服务器厂商补充相应的能力,近年来已有迹象,例如云服务商和服务器厂商在私有云领域直接竞争,大模型则将这一竞争推到更深层次,新华三于去年底推出的“一体·两中枢”智慧计算体系,增加了竞争筹码。

“一体”是指新华三以CPU、GPU和xPU为核心,构造出的覆盖通用计算、异构计算等全场景的多元计算体系,并在近年通过液冷等低碳技术的融合,构建起高效、低碳数据中心的算力基石;

“两中枢”分别对应智能算力中枢(傲飞)和智能管理中枢,新华三智能算力中枢(傲飞)能实现传统科学计算与AI计算深度融合,同步实现科学计算批量作业和AI容器作业的调度编排,满足教育、科学、能源、制造等高性能计算场景需求。

智能管理中枢提供部署、调优、节能、诊断、退役都能能力,为数据中心服务器提供全生命周期智能管理,能帮助企业提高运维效率,降低运维成本,客户可根据具体的业务需求对服务器进行灵活的配置部署,从而打造自己专属的运维环境。

可以理解“一体”是新华三的算力基础,而“两中枢”拓展了智算算力的集群能力,对应的是服务器集群的管理。

譬如ChatGPT参数达到了1750亿,每个参数如果只算2个字节,意味着需要8块最高端的GPU卡,才能容下所有的参数,实现灵活的应用,进一步驱动算力从通用转向GPU、NPU或者xPU等综合算力,高并发的情况需要更多差异化算力单元来满足。

大模型改变算力,新华三加码算力集群能力

“我们看到调度比较有效率的就是64卡和128卡,再往高其实已经开始有衰减,需要跨另外一个网络做调度。”刘宏程说。

据了解,新华三大部分客户所使用的GPU集群数量在64、128和256卡级别,衰减相对比较弱,现有的网络限制比较接近128卡的算力限制。举例来看,现在网络架构可能8000个端口,一般一个计算模块对一个网络端口进行调度,8000个端口对应128个GPU,超过这个数量,就跨入另外一个网络,需要两台交换机。

“当前GPU市场较为火热,但是NPU和xPU的技术在中间也起到了非常关键的作用”,刘宏程说,“一体”就是多元算力,新华三之前提出的观点得到了验证,让用户根据场景来选择不同的算力单元,满足不同的计算需求。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者微信mr3right交流)返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-21 17:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

新华三:营收持续增长彰显龙头风范 全栈智算赋能百行百业
...份额前二,连续六年安全硬件市场份额前二,连续六年x86服务器市场份额前三,连续七年存储市场份额前三。2024年,新华三发挥算力×联接倍增效应,依托全新一代智算产品,持续塑造智
2025-05-06 13:34:00
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
几乎是一夜之间,AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知,搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台
2023-10-21 17:43:00
名城视窗·攀登进行时④ |“我们一同起飞”——新华三集团“双新”提能攀登行动实践探索
...,几千个细小零部件在极短时间内快速组合,完成组装的服务器源源不断地从生产线上运送出来。这是行业首创的全自动服务器生产线,整体自动化率达到88%,人均产出提升了5.1倍,订单交
2024-04-12 08:07:00
...同市场、不同客户的需求;还倡导联接标准化,积极推动服务器内、外部GPU联接标准化和软件生态标准化。”“面对日新月异的技术迭代,专业复杂的模型训练推理,眼花缭乱的细分场景应用,
2024-04-23 15:33:00
重构计算,九章云极DataCanvas智算操作系统重磅发布
...需求满足机制,包含超级智算集群、弹性容器集群、GPU云服务器、AI容器实例等系列产品,为精准匹配和高效满足多样化规模及复杂度的算力需求提供保障为AI而生专注于人工智能核心任务
2024-04-19 11:55:00
...基础运营商为代表的宁夏企业截至10月底,已建并投产GPU服务器541台,在建待投产1572台,宁夏总GPU服务器已达到2100台
2023-11-27 06:45:00
恒润股份:“东数西算”芜湖智算中心首期算力交付
...身在新一代绿色数据中心方面的能力,引入业界最领先的服务器、存储、交换机、液冷设备等数据中心设施,建设液冷智算中心产业园,打造“东数西算”的“芜湖样板”。图为智算中心首期算力启
2023-09-27 19:39:00
夯实智算基础底座 图灵小镇助力产业AI化变革
...了“算力×联接”战略,推出了以高速无损网络+人工智能服务器+算力调度管理平台为核心的全栈智算解决方案,目前已经为超过1100名客户提供澎湃智算支撑。同时,其发布的业界首个私域
2024-09-05 16:26:00
新华三发布私域大模型“百业灵犀”linseer
...。在大会中获取到,新华三推出专为大模型训练而生的AI服务器,让大语言模型训练时间缩短70%;全球首发51.2T,800G硅光数据中心交换机
2023-06-11 22:14:00
更多关于科技的资讯:
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00