我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI Triton开始合并AMD ROCm 代码

类别：科技发布时间：2023-09-03 21:57:00 来源：瘦子财经

9月3日消息，Triton是一种类似于Python的开源编程语言，它可以使没有CUDA经验的研究人员顺利编写高效的GPU代码（可以理解为简化版CUDA），而且号称小白也可以写出与专业人士相媲美的代码，就是让用户用相对较少的努力实现最高的硬件性能，但Triton初期只支持英伟达GPU。

OpenAI声称：Triton只要25行代码，就能在FP16矩阵乘法上达到与cuBLAS相当的性能。

从Github我们可以看到，OpenAI已经开始在最新的Triton版本中合并AMDROCm相关分支代码，也正因此暴露了很多东西。也就是说，最新Triton后端已适配AMD平台，可谓意义重大。

通过官方的说法来看，他们已经通过了“test_core.py”上的大多数单元测试环节，但由于各种原因跳过了一些测试。

IT之家注意到，OpenAI还宣布将于9月20日上午10点至下午4点在加利福尼亚州山景城的微软硅谷园区举行Triton开发者大会，而日程安排中就包括“将Triton引入AMDGPU”和“Triton的英特尔XPU”两大环节，预计Triton将很快摆脱英伟达CUDA垄断的历史。

值得一提的是，Triton是开源的，比起闭源的CUDA，其他硬件加速器能直接集成到Triton中，大大减少了为新硬件建立AI编译器栈的时间。

在此前发布的PyTorch2.0版本中，TorchInductor便引入了OpenAITriton支持，可为多个加速器和后端自动生成快速代码，同时实现用Python取代CUDA编程来写底层硬件的代码。也就是说，Triton已经是PyTorch2.0后端编译器关键构成部分。

实际上，此前AMDROCm则主要是采用 Hipify工具实现CUDA兼容，而随着AMD开始为RDNA3消费级显卡提供ROCm支持，预计后续将会有更多平台选择适配AMD硬件。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-09-03 23:45:03

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于代码,代码,硬件,英伟,编译器,支持的资讯：

微调大模型，AMD MI300X就够了！跟着这篇博客微调Ll

...，结合了类似 NumPy 的 API、自动微分功能以及 Google 的 XLA 编译器。它在模型并行化方面提供了优秀的 API

2024-10-09 09:52:00

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...量内存3. 创建并管理多条并行线程，提高数据处理效率4. 编译器、调试器和性能分析工具组成的工具链，，帮助开发者优化代码简而言之

2024-09-07 09:48:00

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...3.0 Beta版本，具备大模型训推一体、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2

2024-07-01 09:21:00

我用 Rust 改写了自己的C++项目：这两个语言都很折磨人

...会优化 Rust 构建时间的条目：更快的链接器Cranelift 后端编译器和链接器标志工作区与测试布局区分最小化依赖功能cargo-nextest使用 PGO 自定义工具链更快的链接器我第一步要做的是分析构建

2023-01-24 12:00:00

鲲鹏原生赋能浩瀚深度，网络数据可视化处理更加高效

...的产品线管理、持续集成过程，在流水线中直接调用毕昇编译器、鲲鹏测试框架、性能分析插件、版本漏洞扫描插件等DevKit工具能力，从而提升版本的性能、测试效率和质量；并基于鲲鹏服

2024-11-20 14:07:00

Linux也变屎山！内核代码突破4000万行 10年膨胀一倍

...不到50万行，剩下的90％相关代码都毫无用处。同样的，编译器、驱动程序也是类似的情况，其中AMD Radeon驱动和相关文档等，就有约500万行代码。不过好的一面是，很多驱动

2025-01-27 12:36:00

开源鸿蒙4.0已发布：代码行数破亿

...新增200多个HDI接口，硬件适配更加便捷，图形框架和方舟编译器（ArkCompiler）也得到了进一步优化。关键是经过三年的发展

2023-11-08 09:38:00

难学、速度慢……有关 Rust 的五大传言，谷歌下场澄清！

...软件开发人员可以在很短的时间内熟悉 Rust。传言 2：Rust 编译器的速度达不到人们的想象——真的！就目前的情况来看

2023-06-30 17:01:00

数据库管理之汇编语言

...尾添加可选的有用注释。6.汇编语言使用汇编程序而不是编译器或解释器进行翻译，并且一条语句只翻译成一条机器代码指令，而高级语言中一条语句可以翻译成多条机器代码。7.汇编程序使用

2022-12-27 13:41:00

更多关于科技的资讯：

廊坊推出算力券撬动人工智能产业

廊坊推出算力券撬动人工智能产业每年投放总额不超过1000万元，已吸引23家初创企业落地河北日报讯（记者刘英、刘杰）“基于流程

2025-11-08 07:54:00

探究供应链金融数字化转型之路

摘要：随着数字经济的深入发展，传统供应链金融暴露出信息不透明、业务流程复杂、风险管控难度大等突出问题，其数字化转型已成为当前行业发展的重要课题

2025-11-08 05:24:00

数字化时代企业管理模式创新路径探讨

摘要：本文探讨数字化时代企业管理模式的创新路径，首先分析数字化对企业管理模式的核心影响，指出其推动管理对象向“人-财-物-数据”融合转变

2025-11-08 05:24:00

智推时代：用GEO打造品牌增长新引擎

在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道

2025-11-07 08:03:00

2025年10月GEO推荐：用户口碑与数据双重验证的服务商榜

（一）开篇引言行业背景与痛点：中国信息通信研究院《2025年数字营销发展趋势报告》指出，截至2025年6月，国内生成式引擎月活用户已突破8

2025-11-07 08:05:00

哪家充电比较省钱？车主服务优惠多比单一品牌可能更实惠

一、旅游出行安全保险尚无权威排名，选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准，产品选择应重点考察保险公司服务能力（偿付能力充足率

2025-11-07 08:06:00

2025年11月GEO公司热度榜：五强排行全解析

当生成式AI技术以迅猛势头重构搜索生态时，如何为企业精准挑选高度契合需求的GEO（生成式引擎优化）服务供应商，已成为抢占下一代流量入口的核心战略动作

2025-11-07 08:06:00

科学实力获市场验证：任我行液体钙获全球销量第一认证

2025年11月初，德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书

2025-11-07 08:07:00

磷虾油产品对比磷虾油品牌深度测评与科学选购指南

近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后

2025-11-07 08:07:00

道路“会思考” 出行更美好！数字道路建设赋能未来之城

数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上，看似普通的路灯杆集合了多种智能设备，成为智慧交通的“眼睛”

2025-11-07 08:20:00

白洋淀上｜在“雄图”，读未来

今年9月27日，雄安图书馆正式向公众开放。一个多月来，已迎来访客20余万人次。这座形如书卷徐徐展开的建筑，不仅是新区一座崭新的文化地标

2025-11-07 08:20:00

关注进博会丨河北再赴进博之约（二）：把全球好物装进“购物车”

把全球好物装进“购物车”——河北再赴进博之约（二）11月6日，在第八届中国国际进口博览会河北省主题展区，河北参展商正在进行路演活动

2025-11-07 08:21:00

“智云经开”创新中心签约落地

南报网讯（通讯员王亚洲朱丽纯记者王婷婷）日前，“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局

2025-11-07 08:23:00

肥乡联社精耕代理保险业务多元发力显成效

今年以来，肥乡联社在省联社及邯郸审计中心的精准指导下，锚定代理保险业务作为中间业务增长的核心抓手，深挖县域保险市场潜力

2025-11-07 10:22:00

行唐联社市仝信用社积极开展网络安全宣传守护客户“钱袋子”

为全面提升金融服务安全性，切实保障广大客户的资金与信息安全，近期，行唐联社市仝信用社积极行动，开展了一系列网络安全宣传与防护活动

2025-11-07 10:24:00

头条订阅服务

OpenAI Triton开始合并AMD ROCm 代码