• 我的订阅
  • 科技

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

类别:科技 发布时间:2023-06-27 22:15:00 来源:浅语科技

微软研究人员日前推出了名为ZeRO++的新技术,用于优化在训练大型AI模型时,容易遇到的数据传输成本和带宽限制的难题,可显著减少大模型训练时间和成本。

据悉,ZeRO++建立在现有的ZeRO传输技术基础上,并提供增强的通信策略,可提高训练效率,同时减少训练时间和成本。

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

▲图源微软

为了减少参数通信量,ZeRO++可对权重进行量化,其利用基于块的量化方法来保持训练精度,这种优化的量化过程相对原始Zero传输技术更快更准确。为了能够尽量减少通信开销,ZeRO++通过在每台机器上保持完整的模型副本,以向GPU显存换取通信带宽。而在梯度通信方面,ZeRO++引入了一种名为qgZ的新的量化梯度通信方式,可以减少跨节点的流量和延迟。

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

▲图源微软

这些改进的通信技术大大减少了通信量,微软研究人员表示,与ZeRO相比,ZeRO++减少了高达4倍的通信量,提高了训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO++实现了平均2倍的加速,使得大模型训练在更多种类的集群上更为可行。

注:例如Turing-NLG、ChatGPT和GPT-4这样的大型模型,其训练需要跨多个GPU设备占用大量显存和计算资源,而ZeRO++引入了通信优化策略,以克服在低带宽集群上进行训练时原有ZeRO传输技术的带宽限制。目前微软已经放出了相关技术文档,研究人员可以利用ZeRO++更有效地训练模型,在AI领域探索新的可能性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-28 06:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软、英伟达纷纷押注小模型,大模型不香了?
...具有更少的参数和更简单的设计,它们需要更少的数据和训练时间——只需几分钟或几小时。这使得SLM更高效,更易于在小型设备上部署。例如,它们可以嵌入到手机中,而无需占用超算资源,
2024-08-26 14:17:00
押注核能!微软决心喂大模型新“弹药”!
...低。仅凭单个 GPU就能支持一个130亿参数的类ChatGPT模型,训练时间也只需要 1.25 小时。最后,只能说,变革的齿轮一旦启动,就很难逆转。微软此番对于AI的投入超乎
2023-09-28 11:06:00
微软亚洲研究院推出工业场景用大模型
微软亚洲研究院日前提出了一种使用 GPT-4模型来控制工业场景的空气调节系统(HVAC)的方法,据称“该方法仅需少量示例样本,就能在成本和效率上优于传统工控系统”。▲图源微软亚洲
2023-08-12 06:27:00
烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
...,或每个月约耗费 300 万美元。在此之下,OpenAI 才找到了微软,寻求资助,共同探索人工智能的发展。一直以来,这些传言并未得到准确的核实,众人只知晓 AI 大模型的运行
2023-03-15 05:00:00
全球五大巨头GPU总量曝光!2025年等效H100或超1240万块
【新智元导读】AI巨头的芯片之争,谷歌微软目前分列一二。而xAI作为新入局者,正迅速崛起。这场竞争中,谁会成为最后赢家
2024-12-03 13:34:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...合进行训练的,专注于高质量、推理密集的数据。 二、训练时间最短不到1周,模型全部开源提供微软还在Hugging Face上公布了这组轻量级模型具体的训练情况
2024-08-22 09:49:00
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...上全球规模最大的AI算力集群中的其中一个。目前,包括微软、Meta等拥有自研大模型的科技公司,AI训练算力集群规模,普遍不超过10万枚训练芯片。特斯拉创始人马斯克成立人工智能
2024-12-04 09:49:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...硬件为核心构建高性能计算集群、提升性能,进一步缩短训练时间……基本所有厂商的大模型的推理、训练都高度依赖英伟达的GPU。来自市场的消息显示,A800的价格一度超过8万元人民币
2023-06-29 12:00:00
日亏500万的OpenAI想搞钱了
...是一款名为Biomes的游戏。Biomes官网显示,该游戏视觉上和微软旗下游戏产品《我的世界》类似。收购一家开源版《我的世界》
2023-08-25 16:34:00
更多关于科技的资讯:
本报讯 日前,中国文房四宝协会市场研究与督导专业委员会(以下简称“专委会”)“跨界赋能・智创未来”专题研学活动,在北京新发地农产品批发市场举办
2025-09-18 11:40:00
□ 左 鲤日前,上海博物馆以“清雍正粉彩蝠桃纹橄榄瓶”为原型设计的蝠桃瓶发光冰箱贴引发争议。有网友认为该文创产品的瓶底开孔与发光设计
2025-09-18 11:40:00
当前,人工智能、虚拟现实(VR)、超高清、多模态等新科技,正以“体验重构者”“需求激活者”“边界拓展者”的角色,为旅游新消费注入强劲动能
2025-09-18 11:45:00
第三届#SpainFoodNation峰会推动西班牙美食参与中国市场
近日,西班牙对外贸易发展和投资局(ICEX)携手西班牙农业渔业和食品部(MAPA)在上海举办了第三届#SpainFoodNation峰会
2025-09-18 11:46:00
山东九羊集团携钢铁大模型亮相全省“人工智能+”创新应用工作会议
9月17日,山东省“人工智能+”创新应用工作会议在济南举行。作为“人工智能+钢铁”领域的企业代表,山东九羊集团有限公司(以下简称山东九羊集团)受邀现场演示钢铁大模型应用实践
2025-09-18 12:27:00
浪潮助力四川教育大数据平台荣获IDC中国未来企业大奖·智慧城市特别奖
9月5日,2025 IDC中国未来企业大奖优秀奖名单正式揭晓,由四川省教育信息化与大数据中心主办,浪潮软件技术支持的“四川省教育大数据平台”建设项目荣获“2025 IDC中国未来企业大奖优秀奖”
2025-09-18 12:28:00
“痛金”让年轻人“上头” 黄金消费刮起“二次元风”
消费日报网讯(记者牛夏风)从“痛车”“痛包”到“痛衣”,“万物皆可痛”的风又吹到了黄金饰品上。“吉伊卡哇”联名款、《天官赐福》联名款
2025-09-18 13:17:00
海南三亚信兴超级体验店重装开业 多重优惠惠及消费者
消费日报网讯(记者郑红梅)9月19日至21日,海南三亚信兴电器超级体验店将迎来重装升级后的盛大开业。此次开业活动以“多重优惠叠加”为核心
2025-09-18 13:18:00
深信服AD以技术之力铸业务之基,稳居IDC市场份额第一
近日,国际数据公司(IDC)发布最新报告,深信服AD斩获2025Q2中国负载均衡市场占有率第一。这已是深信服AD连续多个季度领跑市场
2025-09-18 13:51:00
不差钱的腾讯,也开始借钱了?
A时隔四年后,腾讯再次发债,首发点心债。腾讯控股在港交所公告称,于2025年9月16日,公司已与经办人就根据计划发行本金总额90亿元的票据订立认购协议
2025-09-18 09:01:00
从“客户”到“伙伴”,济宁银行全周期金融服务构建财富管理新生态
鲁网9月18日讯济宁银行坚守“金融为民”初心,不断创新金融产品,完善服务渠道,努力为客户提供更加专业、更有温度的金融服务
2025-09-18 10:53:00
厦门网讯(厦门日报记者 林露虹)作为2025厦门国际动漫节配套活动,第三届游戏创业者路演系列活动(简称“游路演”)将于10月29日至30日举行
2025-09-18 08:20:00
厦门网讯(厦门日报记者 沈彦彦)近日,厦门市商务局发布2025年家电以旧换新、3C产品购买补贴及家装厨卫“焕新”(智能家居)补贴第六批参与企业的汇总名单
2025-09-18 08:20:00
2025腾讯全球数字生态大会零售与生活专场:首次披露智能化、国际化最新能力布局
9月16日,2025腾讯全球数字生态大会于深圳正式启幕。大会以“增长和效率”为核心命题,作为实体经济的“晴雨表”和最贴近消费者的关键环节
2025-09-18 08:09:00
从“借船”到“造船” 江西文化“新三样”逐浪全球新蓝海
上饶高铁经济试验区一幢写字楼内,数百个工位“蜂巢式”铺陈,键盘敲击声此起彼伏,数万部原创小说从这里诞生,漂洋过海,吸引超2000万海外读者日夜“追更”
2025-09-18 06:31:00