• 我的订阅
  • 科技

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

类别:科技 发布时间:2023-06-27 22:15:00 来源:浅语科技

微软研究人员日前推出了名为ZeRO++的新技术,用于优化在训练大型AI模型时,容易遇到的数据传输成本和带宽限制的难题,可显著减少大模型训练时间和成本。

据悉,ZeRO++建立在现有的ZeRO传输技术基础上,并提供增强的通信策略,可提高训练效率,同时减少训练时间和成本。

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

▲图源微软

为了减少参数通信量,ZeRO++可对权重进行量化,其利用基于块的量化方法来保持训练精度,这种优化的量化过程相对原始Zero传输技术更快更准确。为了能够尽量减少通信开销,ZeRO++通过在每台机器上保持完整的模型副本,以向GPU显存换取通信带宽。而在梯度通信方面,ZeRO++引入了一种名为qgZ的新的量化梯度通信方式,可以减少跨节点的流量和延迟。

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

▲图源微软

这些改进的通信技术大大减少了通信量,微软研究人员表示,与ZeRO相比,ZeRO++减少了高达4倍的通信量,提高了训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO++实现了平均2倍的加速,使得大模型训练在更多种类的集群上更为可行。

注:例如Turing-NLG、ChatGPT和GPT-4这样的大型模型,其训练需要跨多个GPU设备占用大量显存和计算资源,而ZeRO++引入了通信优化策略,以克服在低带宽集群上进行训练时原有ZeRO传输技术的带宽限制。目前微软已经放出了相关技术文档,研究人员可以利用ZeRO++更有效地训练模型,在AI领域探索新的可能性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-28 06:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软、英伟达纷纷押注小模型,大模型不香了?
...具有更少的参数和更简单的设计,它们需要更少的数据和训练时间——只需几分钟或几小时。这使得SLM更高效,更易于在小型设备上部署。例如,它们可以嵌入到手机中,而无需占用超算资源,
2024-08-26 14:17:00
押注核能!微软决心喂大模型新“弹药”!
...低。仅凭单个 GPU就能支持一个130亿参数的类ChatGPT模型,训练时间也只需要 1.25 小时。最后,只能说,变革的齿轮一旦启动,就很难逆转。微软此番对于AI的投入超乎
2023-09-28 11:06:00
微软亚洲研究院推出工业场景用大模型
微软亚洲研究院日前提出了一种使用 GPT-4模型来控制工业场景的空气调节系统(HVAC)的方法,据称“该方法仅需少量示例样本,就能在成本和效率上优于传统工控系统”。▲图源微软亚洲
2023-08-12 06:27:00
烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
...,或每个月约耗费 300 万美元。在此之下,OpenAI 才找到了微软,寻求资助,共同探索人工智能的发展。一直以来,这些传言并未得到准确的核实,众人只知晓 AI 大模型的运行
2023-03-15 05:00:00
全球五大巨头GPU总量曝光!2025年等效H100或超1240万块
【新智元导读】AI巨头的芯片之争,谷歌微软目前分列一二。而xAI作为新入局者,正迅速崛起。这场竞争中,谁会成为最后赢家
2024-12-03 13:34:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...合进行训练的,专注于高质量、推理密集的数据。 二、训练时间最短不到1周,模型全部开源提供微软还在Hugging Face上公布了这组轻量级模型具体的训练情况
2024-08-22 09:49:00
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...上全球规模最大的AI算力集群中的其中一个。目前,包括微软、Meta等拥有自研大模型的科技公司,AI训练算力集群规模,普遍不超过10万枚训练芯片。特斯拉创始人马斯克成立人工智能
2024-12-04 09:49:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...硬件为核心构建高性能计算集群、提升性能,进一步缩短训练时间……基本所有厂商的大模型的推理、训练都高度依赖英伟达的GPU。来自市场的消息显示,A800的价格一度超过8万元人民币
2023-06-29 12:00:00
日亏500万的OpenAI想搞钱了
...是一款名为Biomes的游戏。Biomes官网显示,该游戏视觉上和微软旗下游戏产品《我的世界》类似。收购一家开源版《我的世界》
2023-08-25 16:34:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦)7日,厦门再添一家市级首店。厦门首家苏宁易购MAX(超级体验店)在湖里万达正式亮相。苏宁易购MAX(超级体验店)营业面积达2万平方米
2025-11-09 08:31:00
乌镇峰会聚焦文化“新三样”:数字内容新引擎成焦点
一步“穿越”到网络小说的奇幻世界、一秒“入戏”学生时代的网剧拍摄实景、一站式集齐3A游戏大作精美原画与典藏周边……风靡全球的文化“新三样”
2025-11-09 08:51:00
聚焦十五运|全运主媒体新闻中心高科技产品多
机器人咖啡机,炫酷运动健身器材,会跑步和握手的机器人……十五运主媒体中心,高科技产品无处不在!进入主媒体中心,一个能够主动与你握手打招呼的机器人
2025-11-09 22:31:00
中国科大实现多体量子速度极限
大皖新闻讯 11月9日,记者从中国科学技术大学获悉,该校郭光灿院士团队在量子系统的演化速度极限研究中取得重要进展。该团队李传锋
2025-11-09 23:35:00
智能床垫争辩未止,aise宝褓已夺最高认证,行业洗牌在即
究竟什么才是真正的“智能床垫”?这个看似简单的问题,在市场上却长期充斥着各说各话的营销迷局。如今,伴随《家具 智能等级评定及标识》(GB/T 46260—2025)国家标准的发布(2026年3月1日正式实施)
2025-11-09 21:51:00
11月8日,在以“AI共生、光启未来”为主题的“互联网之光”博览会现场,全球600多家企业带来的1000多项人工智能前沿技术产品纷纷亮相
2025-11-09 15:58:00
2025雷达无线电产业大会在宁落幕“空中卫士”筑起低空防线配套设备穿上“防护铠甲”南报网讯(记者张甜甜曹丽珍)11月8日
2025-11-09 09:34:00
小米Hyper AI获2025“直通乌镇”全球互联网大赛智能终端赛道特等奖
11月9日,2025“直通乌镇”全球互联网大赛智能终端赛道成绩揭晓。Xiaomi HyperAI获得该赛道特等奖。“直通乌镇”全球互联网大赛是世界互联网大会乌镇峰会标杆性赛事
2025-11-09 18:10:00
11月8日下午,在2025年全球互联网大会“互联网之光”博览会现场,各类机器人成为最耀眼的明星,它们既是舞台上的表演者
2025-11-09 10:23:00
日常生活中,电梯是高层楼宇里不可或缺的垂直交通工具。超过80%的电梯在发生故障前都会释放“求救信号”。这些容易被忽视的异常现象
2025-11-08 05:24:00
进博会上,南京“买手团”大逛“世界超市”全球直采,优品好物装进“购物车”□南京日报/紫金山新闻记者 黄琳燕11月7日,第八届进博会7
2025-11-08 09:31:00
八赴进博彰显深耕决心!凯克携 77 年加拿大真洋牌伟博天然,以全维优势点亮健康新生态
2025 年第八届中国国际进口博览会(进博会)盛大启幕,凯克集团再度携手 webbernaturals 伟博天然荣耀参展
2025-11-08 14:40:00
双11调研:家庭日用类消费成65.89%人大促固定选择,京东成消费者下单日百和服务首选平台
双11已步入第十七个年头,消费者的心态与行为模式也发生了深刻变化。越来越多的中国家庭将双11视为进行生活规划与品质升级的关键节点
2025-11-08 14:42:00
从巴黎歌剧院到家庭客厅,海信激光电视携手 DEVIALET 帝瓦雷开启“家庭影院新世代”
法国当地时间11月4日,全球显示领军品牌海信与知名高端音响品牌 DEVIALET 帝瓦雷在巴黎举办了一场科技与艺术的跨界盛宴
2025-11-08 14:43:00
双11囤货别忘囤“快乐”!华为应用解锁花式娱乐新体验
这个双11,你的购物车是不是已经塞满了心仪的好物?从智能家电到秋冬新装,从母婴用品到家居日用。在忙着为全家人囤货的同时
2025-11-08 14:44:00