我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
2月24日消息,在第56届IEEE/ACM微体系结构国际研讨会上,美国加州大学河滨分校(UCR)的研究人员展示了一种全新的方法,可以实现计算速度翻番、能耗减半的效果。
研究人员表示这项技术理论上适用于从智能手机到数据中心服务器的任何处理器和加速器,但需要进一步地开发适配。
加利福尼亚大学电气与计算机工程系副教授、本研究报告的共同作者曾宏伟(Hung-WeiTseng)表示:
你不需要增加新的处理器,可以在现有计算机平台上部署。这项技术的核心,是帮助你更合理高效地管理可用硬件资源。
研究人员开发的平台打破了传统的编程模式,团队将其称为同步异构多线程(SHMT)。传统编程模式是在一段时间内,只向系统的一个计算组件(中央处理器、图形处理器、张量处理器或其他处理器或加速器)提供数据,而SHMT技术在所有组件之间同时并行执行代码。
传统、现代异构和SHMT的并行化方法比较
SHMT采用质量感知工作偷取(QAWS)调度策略,保持平衡控制计算质量和工作负载,因此降低了资源调用。
SHMTruntime系统将创建一组虚拟操作(vOPS),并划分为一个或多个高级操作(HLOP),以便同时使用多个硬件资源。
根据所选政策加速SHMT计算
传统计算与SHMT的活动和闲置消耗比较
SHMTruntime系统将HLOPS分配到任务队列,在目标硬件上运行。由于HLOPS与硬件无关,runtime系统可根据需要将任务重定向到计算平台的一个或另一个组件。
研究人员以他们创建的测试平台为例,展示了新软件库的有效性。他们创造了一种混合体,既可以被视为智能手机,也可以被视为一种个人电脑,甚至是服务器。
该测试平台基于一块带有PCIe接口的背板,一台搭载英伟达NanoJetson模块组的“计算单元”,通过M.2KeyE插槽连接谷歌Edge加速器(TPU)。该模块带有四核ARMCortex-A57处理器(CPU)和128个Maxwell架构图形内核(GPU)。
本系统的主内存为4GBLPDDR4,频率为1600MHz,速度为25.6Gbps,用于存储一般数据。EdgeTPU模块额外包含8MB内存,并使用UbuntuLinux18.04作为操作系统。
在一个使用标准测试应用程序的简易异构平台上运行SHMT软件包的结果表明,与基本计算分配方法相比,采用最有效策略的QAWS框架的计算速度提高了1.95倍,消耗显著降低了51%。
这种方法如果应用于数据中心,可以在保持现有硬件不变的情况下,最大化性能收益。目前,所提出的解决方案尚未准备好付诸实施,但肯定会有很多人对此感兴趣。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-02-25 09:45:05
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: