512指令集发飙性能暴涨17倍：自家CPU却不能跑

文章正文

发布时间：2024-11-10 21:13

Intel近日更新了开源的C++头文件库，正式支持AVX-512 SIMD指令集，相比此前的AVX-2指令集，可以提供更高性能的SIMD排序。

基于AVX-512指令集，C++头文件库可以对16位、64位数据类型进行快速排序，实测在一套Intel Tiger Lake 11代酷睿系统上，NumPy Python的性能提升了多达10-17倍。

具体来说，16位数据排序性能提升了17倍，32位数据也有12-13倍，64位浮点数据则可以提速10倍。

这证明，AVX-512只要适配优化得当，带来的性能提升是十分显著的，而且不一定非得吃掉多高功耗。

不过，Intel 12/13代酷睿因为引入混合架构，不得不牺牲了AVX-512，自然无法从中受益，AMD Zen4架构的锐龙7000系列则首次加入了AVX-512。

这就有点尴尬了。

Intel AVX-512指令集发飙性能暴涨17倍：自家CPU却不能跑

标签

512指令集发飙 性能暴涨17倍：自家CPU却不能跑