• 我的订阅
  • 科技

Intel AVX-512指令集发飙 性能暴涨17倍:自家CPU却不能跑

类别:科技 发布时间:2023-02-21 06:00:00 来源:驱动之家

Intel近日更新了开源的C++头文件库,正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。

基于AVX-512指令集,C++头文件库可以对16位、64位数据类型进行快速排序,实测在一套Intel Tiger Lake 11代酷睿系统上,NumPy Python的性能提升了多达10-17倍。

具体来说,16位数据排序性能提升了17倍,32位数据也有12-13倍,64位浮点数据则可以提速10倍。

这证明,AVX-512只要适配优化得当,带来的性能提升是十分显著的,而且不一定非得吃掉多高功耗。

不过,Intel 12/13代酷睿因为引入混合架构,不得不牺牲了AVX-512,自然无法从中受益,AMD Zen4架构的锐龙7000系列则首次加入了AVX-512。

这就有点尴尬了。

Intel AVX-512指令集发飙 性能暴涨17倍:自家CPU却不能跑

返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-21 07:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英特尔宣布更新C++文件库:数据排序性能增加17倍
AVX 512是最新的一代指令集,相比较以前的指令集,AVX 512指令集看起来更加偏向于专业应用,尤其是数据传输以及AI训练等领域,而想要完整地使用AVX 512指令集,除了硬
2023-02-23 07:00:00
骁龙8至尊版被榨干了!一加13性能实测
...构与优化加速,以及利用高效的并行计算能力,使得单一指令能够同时处理多个数据单元,显著降低了内存访问的频率。 这一创新技术带来了最高可达3倍的算法执行效率提升,在多媒体处理、
2024-11-05 23:09:00
还在人工炼丹?自动提示工程指南来了,还带从头实现
...理解。对于某些任务而言,我们也很难准确而简洁地传达指令。另外,人类也没有能力尝试每一个可能的提示词及变体。这就像是之前监督式机器学习时代早期的超参数优化(HPO):人工尝试不
2024-09-10 13:39:00
...焦办文、办事、办会核心场景,开发四大功能模块:智能文件库支持个人资料库管理;智阅智问提供政策解读、舆情分析等交互服务;智能体中心预制100+政务智能体模板(文件校核助手、政策
2025-02-26 08:45:00
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令
2024-08-05 09:37:00
ibm开源“最先进”和高性能的granite代码模型
...入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种变体,适用于复杂应用现代化、代码生成、修复错误、解释和记录代码、维护数据库等任务。这些代码模
2024-05-22 10:19:00
coloros15将搭载极光引擎与潮汐引擎,重构安卓流畅体验
...库算法的重构、加速,基于更高效的并行化运算,让一条指令能够同时作用于多个数据单元,有效减少内存访问次数,实现最高3倍的算法效率提升,对多媒体、文件解压缩、应用启切等不同用户场
2024-10-09 19:52:00
我用 Rust 改写了自己的C++项目:这两个语言都很折磨人!
...义容器、功能类和函数、I/O、并发、泛型、宏、SIMD(单指令多数据流)、继承等等,多少都有使用。其实答案也很简单
2023-01-24 12:00:00
risc-v是什么?
...码,软件必须将这些单词和符号,转换为芯片可以读懂的指令。(来源:Pixabay)工程师会用特定的二进制序列来告诉硬件执行某些操作。例如,代码“100000”可以命令芯片把两个
2023-01-26 20:25:00
更多关于科技的资讯: