数组的基本概念:数组是最简单最常用的数据结构,但是也有一些注意事项:
(1)数组的分配方式以及存储位置;
(2)初始化;
(3)不同语言中的数组高级定义;
(4)多维数组;
C/C++中数组分配方式:
(1)int a[10];
适用于数组长度已知或者对数组长度不敏感的情况,比如定义一个字符串。
(2)int *a = (int *)malloc(sizeof(int)*n);
用在C中,适用于动态申请数组的长度。记得最后要free,防止内存泄露。
(3)int[] a = new int[n];
用在C++中。最后要delete。
进程的虚拟地址空间:
。
进程在运行的过程中会将地址划分为许多段,重要的有两个:运行时堆和用户栈。动态申请的数组(malloc和new)会在运行时堆中,常量数组(int a[10])会放在用户栈里面。放在运行时堆中的数组是永久性的,不主动释放就会永久存在,所以才会导致内存泄露。而在用户栈空间是临时,会随着函数的调用和返回进行回收。所以我们不能返回局部变量的地址,尤其是返回一个常量数组的首地址,因为这个地址会在用完之后被回收。所以说一个函数如果在函数内部被修改,想要在函数外部继续用的话,就要使用动态分配的数组。
C/C++中数组的初始化
编程中很多bug都是由直接引用未初始化的变量导致的,一般数组的初始话如下:
(1)全局数组自动初始化;
(2)malloc方式不初始化,可以用memset(可初始化为0或者-1),fill进行初始化;
(3)new方式需要根据编译器判断;
基础的数组直接操作内存,效率高,但是缺乏丰富的api,所以高级语言往往会有相应的高级实现。C/C++中使用STL中的vector.
多维数组是一维数组的扩展,二维数组可以用来描述矩阵或者图,如下:
int a1[10][10];//要求数组的两维都确定; int **a2;//两维都不确定; int* a3[10];//每一维单独分配,长度可以不一致; vector<int> a4[10];//只能在C++中使用; vector<vector<int>> a5;//只能在C++中使用;
多维数组在访问过程中要注意cache缺失问题,数组可以有按行操作方式和按列操作方式。按行操作方式要好过按列操作方式。因为二维数组加载到cache的过程是按行来的,所以当在访问某一行的时候,这一行的元素都已经在cache中了。但是按列方式访问就不同,通常只有一个元素在cache中,其他元素都会缺失的,所以按列访问会造成严重的cache缺失问题,会严重影响性能。
数组在排序中的作用
对于常用的七大排序,在我前面几篇博客中都有讲到,包括代码实现。其中数组在排序中有非常大的作用,下面做一个简单的排序概述:
复杂度为O(n^2):
(1)插入排序-复杂度为O(n^2)中最快的;
(2)选择排序、冒泡排序比较慢,一般会出现在面试题中。
复杂度为O(N*logN):
(1)快速排序:基于比较的排序中速度最快的;
(2)归并排序:实际中较少使用,经常在面试中;
(3)堆排序:实际中较少使用,但是堆很常用;
复杂度为O(n),只能对正整数进行排序:
(1)基数排序-复杂度O(n+r),r为基数;
(2)计数排序-复杂度O(n+k),k为元素范围;
但是在实际开发中,C/C++中自带了排序函数:
(1)在C语言中有qsort函数,需要自定义cmp比较函数,函数形式如下:
int cmp(const void *a,const void *b);
(2)C++中,STL中自带排序函数sort,调用方法如下:
sort(a.begin(),a.end(),[greater<int>() | less<int>()]);