在需要计算结构体大小的时候,涉及到的一个问题就是其对齐模数
计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。
也就是说对齐模数就是这个数据类型占用的空间大小。
关于结构体长度的计算,我查了一下,有两种理解的方式:
方式一:
当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1(类型S强于T)的整数,我们就称类型S的对齐要求比T强(严格),而称T比S弱(宽松)。
struct A{ short a; //k为1 int b; //k为4 char c; //k为1 double d; //k为8 }a;
ANSI C规定一种结构类型的大小是它所有字段的大小以及字段之间或字段尾部的填充区大小之和。填充区就是为了使结构体字段满足内存对齐要求而额外分配给结构体的空间。那么结构体本身也有对齐要求,ANSI C标准规定结构体类型的对齐要求不能比它所有字段中要求最严格的那个宽松,可以更严格。
也就是说,结构体的模数应该是字段中最强字段类型模数的整数倍。
所以上面的代码对应的内存布局图应该是这样:
int类型强于sort类型,则int变量的首地址应该是4的倍数;double的类型强于char,double的首地址就应该是8的倍数。
这里,padding是填充区,注意,填充区就是为了使结构体字段满足内存对齐要求而额外分配给结构体的空间。只有当结构体中的成员一种类型S的对齐模数与另一种类型T的对齐模数不一致的时候,才可能产生填充区。
在上面的结构体中,a与b之间填充了两个空间,b的类型强于c,所以b到c不需要填充空间,c的前面已经占用了8个字节,而c本身还要有1个字节的空间即位置这时到了9,所以c到d还要填充7个空间,即:
打印地址:
所以:结构体a占用的内存空间大小应该是24。
但而如果把结构体A的位置改变一下:
struct B{ short a; //模数为2 char c; //模数为1 int b; //模数为4 double d; //模数为8 }b;
那么其对应的内存分布发生了改变:
打印结果:
综上,可以得出:
- 先计算变量。结构体中变量的位置,必须是对齐模数的整数倍,不是整数倍则会分配填充区进行填充。
- 再计算结构体。结构体的长度是对齐模数和填充区的和。
但此时,还要考虑到结构体自身的对齐模数(结构体也是基本数据类型)。他的模数是#pragma pack定义的模数与结构体内部最大的基本数据类型成员长度中数值较小者。结构体的长度应该是该模数的整数倍。
如下面的示例
struct B{ int b; //模数为4 char a; //模数为1 }b;
此时,结构体中的变量的总长度为5,按上面的想法,得出此结构体的长度应该是最强类型int的倍数,则为4 * 2 = 8:
是的,就是8,但是,如果加上编译选项#pragma pack预处理指令:
#pragma pack(push, 2) struct B{ int b; //模数为4 char a; //模数为1 }b; #pragma pack(pop)
此时成员b的对其模数应该以2为主,a的是1,小于2,则继续以1的对齐模数为主。但结构体的模数k应该是编译编译选项与结构体内部数据类型最强的成员长度中数值中的较小者,这里是2,所以a的长度就变成了6(2的倍数):
在实际开发中,通过指定/Zp编译选项或者在代码中用#pragma pack指令来更改编译器的对齐规则。比如指定/Zpn(VC7.1中n可以是1、2、4、8、16)就是告诉编译器最大对齐模数是n。
在这种情况下,所有小于等于n字节的基本数据类型的对齐规则与默认的一样,但是大于n个字节的数据类型的对齐模数被限制为n。如果n = 1,那么结构体的大小就是各个字段的大小之和,在Moses中定义结构体的地方随处可见,这样做可以减少结构体所占用的内存空间。
#pragma pack(push, 1) struct B{ int b; //模数为4 char a; //模数为1 }b; //此时结构体变量b的长度就为5 #pragma pack(pop)
方式二:
- 先计算变量。根据对齐模数计算结构体变量中的起始地址,必须是对齐模数的整数倍,不是整数倍会自动补齐。
- 再计算结构体。根据结构体的对齐模数计算结构体的大小。结构体的对齐模数是#pragma pack定义的模数与结构体内部最大的基本数据类型成员长度中数值较小者。结构体的长度应该是该模数的整数倍。(但这里要注意如果有预处理指令定义时,变量的模数如果大于n,则按n的对齐规则)
按照这种方式:
struct A{ short a; //模数为2 int b; //模数为4 char c; //模数为1 double d; //模数为8 }a;
1.先计算结构体中成员的地址:
a:地址为0,是其模数2的倍数,所以不再补齐。
b:如果不对齐,则地址为2。不是模数的整数倍,应补齐2个空间(其实也就是方式一中的填充区),地址变成4。
c:此时地址为8,是1的整数倍,不再补齐。
d:如果不对齐,则地址为9。所以应补齐8个空间,地址变成16
此时结构体中成员占据的空间为24
通过打印地址也可验证:
2.计算结构体模数:
此时没有定义编译器指令,所以,结构体模数应该是其成员中最大占用空间类型的模数,也就是8,其大小为24,是8的倍数,所以结构体不再对齐。
对于这两种方式,我觉得方式二可能更好理解一些,但是要注意考虑到编译指令的问题,最后得出:
1.当没有定义编译指令n时:
结构体长度= 结构体内成员对齐后占用的空间之和(两两对比);
之后还需验证结构体地址是否是成员最强类型变量模数k的的整数倍。
2.当定义了编译指令n时:
如果类型强度小于n那么还是按照成员的对齐规则。如果是大于n则需按照n的对齐规则。
同样在之后还是要验证结构体地址是否是对齐模数的整数倍。如果不是,则结构体模数同样也要进行对齐。