高效编程之cache命中对于程序性能的影响

下面这个代码用两个双层循环遍历了一个二维数组里所有的元素，以我自己机器的测试
上面那个循环耗时基本为下面的一半，两个循环的时间复杂度相同，为什么会有这么大的差别？

首先要明白的是不管是几维数组，他们都是用一块地址连续的内存来存储所有的元素，而内存布局的顺序是一整行接着下一个整行排列，第一个循环是一行一行访问，所以从内存上看是顺序的遍历了这块内存，每次读取的位置都在上一次的附近，所以cache命中率高。第二个循环是一列一列访问，可以说访问的元素都不是连续的内存访问(相隔了一行的大小)，从而降低了cache的命中率。

cache的命中率对多层循环的影响是最明显的，因此在设计循环逻辑的时候，如果有某个数据结构需要多次访问，尽量让其全部在最里层中完成访问，提高cache对其的命中率。

#include <stdio.h>

#include <stdlib.h>

int main()

{

     int hang = 1024*8;

     int lie = 1024*8;

     int c = 0;

     int **arr = (int **)malloc(sizeof(int*) * lie);

     for(c = 0; c < lie; c++)

     {

          arr[c] = (int*)malloc(sizeof(int) * hang);

     }
struct timeval time1, time2;

     int i, j;
gettimeofday(&time1, 0);

     for(j = 0; j < lie; j++)

     {

          for(i = 0; i < hang; i++)

          {

               arr[j][i] ++;

          }
}

     gettimeofday(&time2, 0);

     printf("time %f\n", (double)(time2.tv_sec-time1.tv_sec) + (double)(time2.tv_usec-time1.tv_usec) /1000000);
gettimeofday(&time1, 0);

     for(i = 0; i < hang; i++)

     {

          for(j = 0; j < lie; j++)

          {

               arr[j][i] ++;

          }
}

     gettimeofday(&time2, 0);

     printf("time %f\n", (double)(time2.tv_sec-time1.tv_sec) + (double)(time2.tv_usec-time1.tv_usec) /1000000);
return 0;

}

高效编程之cache命中对于程序性能的影响

时间： 2024-10-10 03:15:57

高效编程之cache命中对于程序性能的影响

高效编程之cache命中对于程序性能的影响的相关文章

【设计优化】-使用缓存（Cache）提高程序性能

聊聊我的高效编程之路

iOS 程序性能优化

C++ 应用程序性能优化

黑马程序员——Java网络编程之UDP传输

黑马程序员——网络编程之CTP传输

[.net 面向对象程序设计进阶] (15) 缓存(Cache)(二) 利用缓存提升程序性能

ASP.NET Core Web 应用程序系列（四）- ASP.NET Core 异步编程之async await

Python学习【第26篇】：并发编程之IO模型