C语言的一大优势就是对内存空间的控制,当然,一般情况下对于开发人员来说都是透明的。看一个始终困扰初学者的问题:字节对齐!
先看四个重要的基本概念:
1.数据类型自身的对齐值:
对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。
2.结构体或者类的自身对齐值:
其成员中自身对齐值最大的那个值。
3.指定对齐值:
#pragma pack (value)时的指定对齐值value。
4.数据成员、结构体和类的有效对齐值:
自身对齐值和指定对齐值中小的那个值。
有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是 表示“对齐在N上”,也就是说该数据的”存放起始地址%N=0“.
而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放。
分析一下下面这段代码:
1 struct stExample 2 { 3 char a; 4 int b; 5 short c; 6 }; 7 sizeof( char ) == 1 8 sizeof( short ) == 2 9 sizeof( int ) == 4 10 11 sizeof( struct stExample ) == 12
stExample结构体占据12 Byte
假设stExample从地址空间0×0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。三个成员的存储位置如图:
1. 第一个成员变量a的自身对齐值是1,比指定或者默认指定 对齐值4小,所以其有效对齐值为1,所以其存放地址0×0000符合0×0000%1=0.
2. 第二个成员变量b,其自身对齐值为4,所以有效对齐值也为4, 所以只能存放在起始地址为0×0004到0×0007这四个连续的字节空间中,复核0×0004%4=0,且紧靠第一个变量。
3. 第三个变量c,自身对齐值为 2,所以有效对齐值也是2,可以存放在0×0008到0×0009这两个字节空间中,符合0×0008%2=0。
所以从0×0000到0×0009存放的 都是stExample内容。再看数据结构stExample的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求, 0×0009到0×0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体stExample所占用。故stExample从0×0000到0x000B 共有12个字节,sizeof( struct stExample )=12.
其实如果就这一个就来说它已将满足字节对齐了, 因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组的存取效率。
试想如果我们定义了一个结构体stExample的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的,如果我们不把结构的大小补充为4的整数倍,那么下一个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了(因为如果以0x0000A最为起始地址,0x0000A%4 != 0, 不能作为结构体起始地址。),因此我们要把结构补充成有效对齐大小的整数倍.
其实诸如:对于char型数据,其自身对齐值为1,short类型为2,int,float,double类型,其自身对齐值为4,这些已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了.
union 共用体的字节对齐情况类似,共用体的自身对齐值决定于成员的最大自身对齐值。