• 我的订阅
  • 科技

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

类别:科技 发布时间:2024-03-04 10:23:00 来源:DeepTech深科技

如果你关注数码科技,那么你一定对“性能过剩论”不陌生。对于普通用户来说,如今的芯片性能足以应对大多数的日常场景。

然而,人工智能应用领域的热潮似乎又重新点燃了许多人对于算力的需求。与此同时,在图形处理与渲染、高性能计算等领域,人们对提升处理器性能的追求从未停歇。

不过,在摩尔定律与登纳德缩放定律都面临危机的今天,除了依赖制程的发展和核心数的增加,我们还能找到其他可行的路径来提升计算机性能吗?

近期,由美国加州大学河滨分校的副教授曾宏伟(Hung-Wei Tseng)领导的研究团队,提出了一种以新的软件框架提高现有计算机处理速度的方法,为我们提供了一种新的性能提升思路。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

图丨曾宏伟(来源:加州大学河滨分校)

为了处理不同类型的数据,现代计算机大都集成了多种处理器,并引入异构计算模型以提升性能。

然而,由于传统的编程框架,包括领域特定语言(domain-specific languages),只能将代码区域(code region)分配给一种处理器,使得其他计算资源闲置而无法用于当前函数的运算,因此现有编程模型并不能充分发挥异构模型的潜力。

而这项名为“同步异构多线程”(simultaneous and heterogenous multithreading,SHMT)的编程和执行模型,旨在克服现有编程模型未能充分利用异构计算系统潜力的限制。

与传统模型不同,SHMT 可以充分利用异构的并行类型。通过结合多种处理单元(如 CPU、GPU、TPU 等)的优势,这种模型能有效提升计算效率和能效。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

(来源:the 56th Annual IEEE/ACM)

此前的研究已经证明,使用了不同处理模型与设计理念的协处理器和硬件加速器,都能以出色的性能执行相同的函数,这为 SHMT 的实现提供了可能。

不过,要将同一函数的计算分解到不同类型的计算资源中,系统面临以下三个挑战:

第一,SHMT 需要某种机制来描述和划分在不同的计算分区上的等效操作和数据;

第二,SHMT 必须能够高效地协调异构硬件上的执行;

第三,由于不同的硬件单元会提供不同质量水平的结果,SHMT 必须在不产生大量额外开销的情况下确保结果。

为了解决这些困难,研究人员开发了一个由三个主要部分组成的系统架构:

首先,SHMT 引入了一种虚拟硬件的概念,允许开发者将计算任务借助一系列虚拟操作(Virtual Operations,VOPs)的形式从 CPU“卸载”。

VOPs 定义了 SHMT 底层硬件可支持的可用操作,进而使整个 SHMT 子系统抽象为一个单一且强大的加速器。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

(来源:the 56th Annual IEEE/ACM)

其次,SHMT 有一套至关重要的运行时系统。它不仅作为虚拟硬件的“驱动程序”,在程序执行期间动态解析 VOPs,还负责评估硬件资源的能力,并据此做出智能的调度决策。

它将 VOPs 进一步分解为高级操作(High-Level Operations,HLOPs),这些 HLOP 作为 SHMT 中的基本调度单位,每个 HLOP 负责执行 VOP 运算的特定部分,且均具有硬件无关性,确保了运行时系统能够根据实际情况灵活调整任务分配。

更进一步地,SHMT 采用了一种质量感知的工作窃取(Quality-Aware Work-Stealing,QAWS)调度策略,以优化资源利用率和提升系统性能。

这种策略通过动态调整工作负载分配来平衡各种硬件资源的使用,减少空闲时间,避免性能瓶颈,同时保证了任务执行的质量。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

(来源:the 56th Annual IEEE/ACM)

为了检验这一模型,该课题组使用 NVIDIA Jetson Nano 模块定制了一个嵌入式系统平台,以模拟移动设备、数据中心服务器等常见使用场景进行验证。

该系统原型由下图所示部分构成:

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

图丨 SHMT 原型平台构成示意图(来源:DeepTech)

在基准应用程序上的检测结果显示,相较于基准方法,采用性能最佳策略的 QAWS 的 SHMT 速度提高了 1.95 倍。

实验表明,所有 QAWS 策略均能有效地提高结果质量,MAPE(平均绝对百分比误差)平均值低于 2%,接近于手动优化的 Oracle 场景。且无论采样率如何变化,QAWS-TS 策略的性能都名列前茅。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

(来源:the 56th Annual IEEE/ACM )

更为重要的是,由于 SHMT 减少了执行时间,并将计算任务转移到耗电更低的 Edge TPU 上,因此它在节约能耗方面展现出了巨大潜力。

实验结果显示,与基线 GPU 相比,SHMT 在 QAWS-TS 策略下平均减少了 51% 的能耗和 78% 的能量延迟积。

同时,得益于 Edge TPU 专用逻辑提供的加速功能,以及 SHMT 并行编程模型使用的低数据交换算法,这一模型也不会导致显著的内存和通信开销。

加州大学团队开发异构编程新模型,开辟提升处理器性能新路径

图 | 相关论文(来源:the 56th Annual IEEE/ACM )

近日,相关论文以《同步异构多线程》(Simultaneous and Heterogenous Multithreading)为题,在加拿大多伦多举行的第 56 届 IEEE/ACM 国际微架构研讨会上发表[1]。

加州大学河滨分校的博士研究生徐冠杰(Kuan-Chieh Hsu)为第一作者,曾宏伟副教授担任通讯作者。

曾宏伟对媒体表示,“你不必增加新的处理器,因为现有的就足够了。”因此,仅需使用现有的处理组件,就相当于降低了计算机硬件成本,同时减少了服务器等设备运行时的能源消耗,也减少了碳排放与水消耗。

但这一模型也面临一些挑战与局限性。例如,如何有效管理和调度多种类型的计算资源以实现最优能效、如何降低编程模型的复杂性、如何降低通信开销以及如何扩展应用平台与场景等问题,而这些也正是曾宏伟团队未来的研究方向。

参考文献:

1.Kuan-Chieh Hsu and Hung-Wei Tseng. 2023. Simultaneous and Heterogenous Multithreading. In Proceedings of the 56th Annual IEEE/ACM International Symposium on Microarchitecture (MICRO '23). Association for Computing Machinery, New York, NY, USA, 137–152. https://doi.org/10.1145/3613424.3614285

2.https://news.ucr.edu/articles/2024/02/21/method-identified-double-computer-processing-speeds

支持:Ren

排版:刘雅坤

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-04 18:45:16

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

量子计算的重大突破?IBM称攻克了“不可靠”难题
...物理学家的兴趣。他们使用一个拥有127个量子比特的量子处理器来模拟127个原子尺度的磁铁棒在磁场中的行为。这些磁铁棒小到足以被量子力学的奇特规则所控制。这是一个简单的系统,被
2023-06-15 11:38:00
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...,大幅超出了传统计算硬件的增长速度。而当前大模型的处理器能效仍小于1TOPS/W,与边缘侧应用需求存在两个数量级的差距,严重限制了大模型的落地。 (摘选自汪玉教授发表于
2024-07-22 13:00:00
AI大算力芯片行业报告:百舸争流,创新者先
...习曲线较长等问题。于是,通用性更强的GPGPU(通用图形处理器)在不断迭代和发展中成为AI计算领域的最新发展方向,当上AI芯片2
2023-06-20 20:00:00
AI手机没有独家大模型供应商
...的挑战。一方面和硬件芯片合作商的模式不同,通常手机处理器高通、PC处理器英特尔芯片,可以为硬件产品提供技术背书。不过在AI技术能力方面,对于手机厂商而言,作为一款面向C端市场
2024-07-25 11:54:00
技术解读: vCPU 从 SMP 走向 Hybrid
... LITTLE)设计的 arm 公司,其系列主打产品 Cortex-X Custom (CXC) 处理器和它的厂商自定义芯片代表 Apple 公司的M系列处理器已经有力地说明了 Hybrid 架构在客户端市场的设计优势
2023-06-30 11:01:00
美国芯片内战
...公司最终都是芯片公司?尽管人人都能用上手机,但 PC 处理器依然是现代生活的计算中心:近 20 亿人每天打开个人电脑工作、学习。这些电脑里的处理器再加上被装在数据中心和超级计
2023-11-02 16:21:00
科学家用中性原子制备量子处理器,实现6100个量子比特
...正地进入到数字计算的时代。迄今量子比特数最多的量子处理器需要了解的是,很多物理比特才能组合成为一个逻辑比特。在行业内公认的实现量子计算的做法是
2024-04-15 11:55:00
amd发布新一代面向ai/hpc加速器
...了最新一代即将上市的笔记本新品所搭载的锐龙8040系列处理器,它继承了RyzenAINPU引擎,速度提升高达60%
2023-12-08 09:59:00
...望于2025年取得RISC-V产业链上下游的集体突破,实现高端处理器芯片产业的自立自强。RISC-V市场规模已超百亿颗北京开源芯片研究院公布第二代“香山”(南湖)开源高性能RISC-V处理器内核等
2023-08-30 05:17:00
更多关于科技的资讯:
即将开幕!首届WCE世界营地博览会,一篇理清所有重点!
想对话全球营地大佬?想抄浙江标杆营地的实战作业?想一站式对接国际资源与供应链?2025年11月7-9日,首届WCE世界营地博览会将在“两山理论”发源地浙江安吉重磅启幕
2025-11-05 08:25:00
近日,太重集团自主研制的国内最大1100吨直臂架门座式起重机,历经海上运输的平稳旅程,顺利抵达用户现场,设备总装工作正式拉开帷幕
2025-11-05 08:30:00
科赴与美团医药健康升级战略合作 为消费者构建更加多元化、便捷的健康解决方案
2025年11月4日,上海 – 今日,在美团北京总部,科赴中国与美团医药健康宣布升级战略合作,双方将在多年合作的基础上
2025-11-05 08:55:00
绘喵教育八周年庆典圆满落幕:以热爱为笔,绘就艺术教育新蓝图
近日,绘喵教育以“无限热爱・无限可能”为主题的八周年庆典活动圆满举行。活动通过“线上直播+线下盛典”双线联动的形式,共同回顾八年深耕插画教育的成长足迹
2025-11-05 10:26:00
“AI+医疗”活力迸发!温州全力打造医学人工智能高地
温州居民李阿姨通过AI助手解读的体检报告;医院放射科利用“AI+云影像”,五分钟就能初筛CT片;糖尿病患者张大伯通过可穿戴设备传输数据
2025-11-05 10:46:00
校宝App荣获“2025榜样教育产品奖”,以持续创新引领教育服务数字化进程
2025年10月21日,2025校长邦T教育创新大会暨“中关村·智聚”教育创新论坛在北京隆重开幕。在大会的焦点环节“第十届榜样教育年度盛典”中
2025-11-05 08:25:00
民营经济发展一线观察·吉民优品|辽源市德弘冰雪运动科技有限公司: 100余道工序铸就专业滑雪靴
走进辽源市德弘冰雪运动科技有限公司生产车间,蓝色的唐老鸭系列滑雪靴正沿着生产线逐步成型。一块块裁片经精准缝合拼接,再通过套楦
2025-11-04 11:38:00
十五运会自动驾驶场景应用启动 滴滴自动驾驶助力智慧出行
11月3日,十五运会和残特奥会自动驾驶场景应用启动仪式在广州天河体育中心举行。启动仪式上,滴滴自动驾驶被授予“自动驾驶服务商”标牌
2025-11-04 13:34:00
从「身份可信度挑战」到「数据篡改威胁」,如何重塑第三方支付安全防线?
网络支付已成为现代生活的「数字基础设施」,其便捷性重构了消费生态,但伴随而来的安全考验已演变为潜在风险——从身份认证的「可信度挑战」到业务合规的「穿透式监管压力」
2025-11-04 13:46:00
近日,安徽安庆怀宁县烟草专卖局锚定营销服务痛点,统筹部署岁末年初卷烟营销工作,切实推动营销工作效能提质升级。打破思维定式
2025-11-04 13:46:00
效果好的辅酶q10排名 五大优质品牌深度测评
“效果好的辅酶q10排名”是众多关注心脏健康、免疫力提升、抗氧化及备孕人群的核心搜索诉求。本文深度调研辅酶Q10行业现状
2025-11-04 13:47:00
主流人形机器人大PK,户外工业场景首选云深处DR02
引言当前,国内人形机器人产业在政策与技术双轮驱动下迎来爆发。据2024世界人工智能大会《人形机器人产业研究报告》,2024 年中国市场规模达 27
2025-11-04 13:47:00
“618”购物节如期而至,这场属于夏日的消费热潮正式拉开帷幕。随着新消费模式的涌现和消费主力的迭代,信用交易成为了当下热络的消费选择
2025-11-04 13:47:00
普惠金融旨在为传统金融服务难以覆盖的个人和企业提供平等、便捷、可持续的金融服务。日前,国务院办公厅印发《关于做好金融“五篇大文章”的指导意见》
2025-11-04 13:48:00
技术、政策、合规交织下的探索   “萝卜快跑”面临三重挑战
2025年7月世界人工智能大会后,上海浦东金桥街头的“萝卜快跑”自动驾驶车辆引发关注:车身同时标注了“无人驾驶测试”、“萝卜快跑”和“大众出行”标识
2025-11-04 14:01:00