我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
英特尔今日发布了全新的高级性能扩展指令集(APX),并介绍了即将为P核和E核提供统一AVX-512支持的新型AVX10指令集。
简单来说,AVX10(AdvancedInstructionExtensions10) ISA是AVX-512的超集,并具有256bit和512bit寄存器大小的所有AVX-512ISA功能。
提醒,这种新的指令集暂时没有英特尔CPU支持——它预计将在未来的芯片中出现,包括“GraniteRapids”。英特尔表示,AVX10将成为其面向未来消费者和服务器处理器的矢量ISA选择。
从最基本的层面来看,AVX10将使同时具有E核和P核的英特尔芯片支持AVX-512,尽管512bit版本只能在P核上运行,不过256bit的AVX-256模拟指令集可以同时在P核和E核上运行。
据介绍,AVX10将包括“带有AVX512VL功能标志的AVX-512矢量指令、最大矢量寄存器长度为256bit以及八个32bit掩码寄存器,以及支持嵌入式舍入的新 256bit指令”。
这个版本可以在P核和E核上运行,但E核限制为最大256bit长度,而P核可以使用完整的512bit矢量,这一点类似于 Arm通过SVE对可变矢量宽度的支持。
英特尔表示,现有应用程序在AVX10上的性能与AVX-512相同,至少在相同的矢量长度上。英特尔还声称:
英特尔AVX2编译的应用程序重新编译为AVX10后无需额外软件调整即可实现性能提升。
得益于新增的16个矢量寄存器和新指令,对于矢量寄存器压力敏感的英特尔AVX2应用程序可获得大幅性能提升。
高度线程化的可矢量化应用程序在使用基于IntelXeonE内核的处理器或具有混合架构的Intel产品时,可能实现更高的总吞吐量。
后续,英特尔将为消费级客户提供MeteorLake,为HPC客户提供GraniteRapids和SierraForest,而这三个系列均采用类似的架构,其P核为RedwoodCove核,E核则基于Crestmont架构。
据悉,英特尔将从第六代Xeon“GraniteRapids”芯片开始支持AVX10首个版本(AVX10.1),但该版本只支持512bit矢量指令,而不是新的256bit矢量指令。
也就是说,这一代只是作为从AVX-512到AVX10的过渡芯片。不过,未来所有的Xeon处理器本身就会继续支持完整的AVX-512指令,以确保传统应用正常运行。
后续的AVX10.2将支持256bit矢量长度和其他新功能,如新的AI数据类型和转换、数据移动优化和标准支持。
为了解决开发者的担忧,英特尔还计划为AVX10实现与AVX-512相比大大简化的枚举方式,并确保每次转向新修订版时都有足够的新指令和功能值得升级变,从而减少版本和枚举膨胀。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-07-25 12:45:12
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: