• 我的订阅
  • 科技

国产GPU突破!摩尔线程发布Torch-MUSA v2.0.0:FP8原生支持

类别:科技 发布时间:2025-05-09 19:12:00 来源:浅语科技

快科技5月9日消息,近日,国产GPU厂商摩尔线程正式发布Torch-MUSA v2.0.0版本,这是其面向PyTorch深度学习框架的MUSA扩展库的重要升级。

在Torch-MUSA中,用户只需指定torch.device("musa"),即可将现有的PyTorch模型迁移到MUSA架构的GPU上运行,无需大幅修改代码,目前Torch-MUSA已完全开源,可通过GitHub获取源代码。

作为本次升级的核心亮点,Torch-MUSA v2.0.0率先在国产GPU上实现了对FP8数据类型的完整支持。

FP8是当前AI计算的一种低精度格式,在支持原生FP8的GPU上,大语言模型训练采用FP8混合精度可大幅提高GPU算力,降低显存占用。

摩尔线程基于新一代MUSA Compute Capability 3.1计算架构的全功能GPU原生支持FP8计算,为Torch-MUSA v2.0.0实现FP8矩阵乘法和分布式通信优化提供了基础。

依托这一底层架构优势,Torch-MUSA v2.0.0能够充分发挥FP8的计算效能,显著提升大语言模型训练和推理的效率。

Torch-MUSA v2.0.0在MUSA计算平台引入多项创新功能,进一步提升深度学习任务的执行效率,主要包括:

1、新增虚拟内存管理支持:

MUSA虚拟内存管理技术能够有效缓解GPU内存碎片化问题,降低模型训练过程中的峰值内存占用,特别适用于FSDP、DeepSpeed和Megatron-LM等主流大模型训练框架。

2、新增MUSA Graph支持:

MUSA Graph技术将多个MUSA内核整合到一个图中,通过单次CPU调度大幅减少启动开销,提升计算效率,同时与CUDA Graph接口高效兼容。

3、torch.compile增加Triton后端支持:

为torch.compile提供了Triton-MUSA后端支持,开发者可以直接使用PyTorch原生接口,获得更高效的性能表现。

不仅如此,Torch-MUSA v2.0.0在完整支持PyTorch 2.2.0的基础上,还新增了对PyTorch 2.5.0的支持,使开发者能够在基于MUSA Compute Capability 3.1计算架构的全功能GPU上,无缝运行新版本的PyTorch。

未来Torch-MUSA还将继续跟进PyTorch的版本更新,计划支持更高版本的PyTorch。

国产GPU突破!摩尔线程发布Torch-MUSA v2.0.0:FP8原生支持

【本文结束】如需转载请务必注明出处:快科技

责任编辑:黑白

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-05-09 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国产显卡第一家!支持DX11,摩尔线程站在了新起点
去年11月份,天极网做了首款国潮游戏显卡摩尔线程MTTS80的评测。就性能而言,MTTS80具备优势,甚至硬件规格也能与主流游戏显卡一争高下,只不过受限于驱动适配等因素,自身实力
2023-06-06 00:22:00
国产GPU为底座,摩尔线程首个千卡智算中心落地
12月19日,观察者网了解到,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办,这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地
2023-12-20 09:46:00
国产GPU云电脑首次支持DirectX 12!摩尔线程发布MT vGPU 2.7.0驱动
快科技3月18日消息,今天,摩尔线程发布云电脑驱动MT vGPU 2.7.0,在国内首次实现了国产GPU云电脑对DirectX 12的支持
2025-03-18 19:26:00
摩尔线程MTT S80测试:国产消费级显卡的天花板
...消费级显卡市场,并且市场上也出现了佼佼者,尤其是以摩尔线程为代表的厂商,更是推出了与主流中端显卡相媲美的显卡产品——MTTS80。摩尔线程表示这款显卡不但能够流畅运行电竞类游
2023-11-06 20:13:00
真正的国产显卡之光!摩尔线程国产GPU、AI与元宇宙多项进展深入解读
一、摩尔线程简史:光速创业 全线出击如今,我们已经有了较为成熟的自主CPU处理器、NAND闪存、DRAM内存、OS操作系统,而作为计算平台中非常关键的一环,GPU显卡,却一直存在
2023-06-05 03:00:00
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...产化集群更是迫在眉睫。值此关键节点,国内GPU头部创企摩尔线程推出的夸娥(KUAE)智算中心解决方案以全功能GPU为底座
2024-04-28 11:52:00
摩尔线程Linux显卡驱动v3.0.0发布:支持Wayland GPU渲染性能提升
快科技5月1日消息,日前,摩尔线程发布Linux驱动程序v3.0.0,全面支持MTT S80和MTT X300显卡。作为v2
2025-05-01 00:37:00
摩尔线程国产游戏显卡正式支持OpenGL 4.0!
硬件不断迭代的同时,摩尔线程在驱动、功能更新上也一直不遗余力,比如Windows驱动已经升级5个版本,比如正在开启对DX11的支持
2023-06-10 18:41:00
国产GPU“独角兽”摩尔线程冲刺科创板IPO
...年内涨幅超过10%商报讯 被业界誉为“中国版英伟达”的摩尔线程上市之路迎来新进展。6月30日,上交所官网显示,摩尔线程智能科技(北京)股份有限公司(以下简称“摩尔线程”)科创
2025-07-02 08:41:00
更多关于科技的资讯:
河北新闻网讯(任蕊)“以前插接一根四分钢丝绳,费时费力。现在用上自制装置,效率翻番!”1月11日,在开滦股份吕家坨矿负950五采回风石门掘进现场
2026-01-19 20:15:00
一家皖企跻身胡润中国人工智能企业10强榜
大皖新闻讯 1月19日,胡润研究院发布《2025胡润中国人工智能企业50强》排行榜,中国科大校友陈天石创立的寒武纪蝉联榜首
2026-01-19 22:42:00
河北新闻网讯(田坤)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)机采科检修车间,一台自主研发的“液压钻车负载敏感阀试验台装置”成功完成首次测试
2026-01-19 20:03:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成井下排水泵房的智能化改造,传统人工巡检模式被远程集中监控替代
2026-01-19 20:04:00
安克与飞书联合发布“安克AI录音豆” 录音可在飞书中被AI调用
2026年1月19日,安克创新与飞书联合发布了最新AI硬件——安克AI录音豆,飞书提供了该产品的软件AI适配与服务。这款产品以极轻的"磁吸纽扣”形态实现无感随身佩戴
2026-01-19 17:13:00
+14!省级专精特新梯队扩容
江南时报讯 近日,江苏省工信厅公示了2025年度省级专精特新中小企业(第二批)认定和通过复核企业名单,苏州市相城区黄桥街道共有14家企业上榜
2026-01-19 17:25:00
2026年潍坊市家电国补启动,享国补到三联家电
鲁网1月19日讯2026年潍坊市家电及数码产品补贴正式上线,标志着新一轮“国补”政策在潍坊全面落地。1月16日,三联家电41周年店庆活动盛大启幕
2026-01-19 17:28:00
近日青岛大学龙云泽团队研发的自供能眼球追踪系统火了,仅凭眨眼摩擦就能发电,还能99%精准捕捉眼球运动,像普通眼镜一样轻便
2026-01-19 18:06:00
简橙钱米第三届“岁月珍藏,财智生花”线下品牌活动圆满结束
2026年1月11日,广州番禺太平木棉之家,以“岁月珍藏,财智生花”为主题的第三届简橙「理」想人生线下品牌活动温馨落幕
2026-01-19 17:32:00
为夯实业务转型升级根基,切实提升普惠金融服务质效,近日,滦州农商银行举办信贷新模式及信贷产品专题培训会。该行信贷相关条线骨干
2026-01-19 17:02:00
1月18日,由城市头条有限公司主办的融媒体平台“城市头条”宣布其官方移动应用“城市头条APP”已正式在官网及各主要应用商店上线
2026-01-19 16:55:00
肥乡联社始终践行“以客户为中心”的服务理念,聚焦网点服务提质增效,不断创新服务模式、精进服务技能、丰富厅堂服务内涵,将服务触角深度延伸至城乡末梢
2026-01-19 14:55:00
1月18日,2026华杰新品盛典暨AIX大家居智能增长引擎发布会在石家庄举办。本次活动以“格物·开悟”为内核,聚焦面向核心伙伴的 "能力交付",共同探索家居行业的智造升级与增长新
2026-01-19 15:35:00
近日,中国人寿保险股份有限公司(以下简称“中国人寿”,股票代码:601628.SH,2628.HK)凭借在保险主业、社会责任
2026-01-19 15:50:00
当黄仁勋在 CES 展台上宣告物理 AI 的 “ChatGPT 时刻” 已至,屏幕这头的大学生群体瞬间分裂成两派:有人对着能精准缝合的手术机器人畅想未来
2026-01-19 15:59:00