结构体struts的长度

在需要计算结构体大小的时候,涉及到的一个问题就是其对齐模数

  计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。

  也就是说对齐模数就是这个数据类型占用的空间大小。

  关于结构体长度的计算,我查了一下,有两种理解的方式:

方式一:

  当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1(类型S强于T)的整数,我们就称类型S的对齐要求比T强(严格),而称T比S弱(宽松)。

struct A{

    short a; //k为1

    int b; //k为4

    char c; //k为1

    double d; //k为8

}a;

   ANSI C规定一种结构类型的大小是它所有字段的大小以及字段之间或字段尾部的填充区大小之和。填充区就是为了使结构体字段满足内存对齐要求而额外分配给结构体的空间。那么结构体本身也有对齐要求,ANSI C标准规定结构体类型的对齐要求不能比它所有字段中要求最严格的那个宽松,可以更严格。

  也就是说,结构体的模数应该是字段中最强字段类型模数的整数倍。

 所以上面的代码对应的内存布局图应该是这样:

  int类型强于sort类型,则int变量的首地址应该是4的倍数;double的类型强于char,double的首地址就应该是8的倍数。

  这里,padding是填充区,注意,填充区就是为了使结构体字段满足内存对齐要求而额外分配给结构体的空间。只有当结构体中的成员一种类型S的对齐模数与另一种类型T的对齐模数不一致的时候,才可能产生填充区。

在上面的结构体中,a与b之间填充了两个空间,b的类型强于c,所以b到c不需要填充空间,c的前面已经占用了8个字节,而c本身还要有1个字节的空间即位置这时到了9,所以c到d还要填充7个空间,即:

打印地址:

所以:结构体a占用的内存空间大小应该是24。

但而如果把结构体A的位置改变一下:

struct B{
    short a; //模数为2
    char c; //模数为1
    int b; //模数为4
    double d; //模数为8
}b;

那么其对应的内存分布发生了改变:

打印结果:

综上,可以得出:

  1. 先计算变量。结构体中变量的位置,必须是对齐模数的整数倍,不是整数倍则会分配填充区进行填充。
  2. 再计算结构体。结构体的长度是对齐模数和填充区的和。

但此时,还要考虑到结构体自身的对齐模数(结构体也是基本数据类型)。他的模数是#pragma pack定义的模数与结构体内部最大的基本数据类型成员长度中数值较小者。结构体的长度应该是该模数的整数倍。

如下面的示例

struct B{
    int b; //模数为4
    char a; //模数为1
}b;

此时,结构体中的变量的总长度为5,按上面的想法,得出此结构体的长度应该是最强类型int的倍数,则为4 * 2 = 8:

是的,就是8,但是,如果加上编译选项#pragma pack预处理指令:

#pragma pack(push, 2)
struct B{
    int b; //模数为4
    char a; //模数为1
}b;
#pragma pack(pop)

此时成员b的对其模数应该以2为主,a的是1,小于2,则继续以1的对齐模数为主。但结构体的模数k应该是编译编译选项与结构体内部数据类型最强的成员长度中数值中的较小者,这里是2,所以a的长度就变成了6(2的倍数):

  在实际开发中,通过指定/Zp编译选项或者在代码中用#pragma pack指令来更改编译器的对齐规则。比如指定/Zpn(VC7.1中n可以是1、2、4、8、16)就是告诉编译器最大对齐模数是n。

  在这种情况下,所有小于等于n字节的基本数据类型的对齐规则与默认的一样,但是大于n个字节的数据类型的对齐模数被限制为n。如果n = 1,那么结构体的大小就是各个字段的大小之和,在Moses中定义结构体的地方随处可见,这样做可以减少结构体所占用的内存空间。

#pragma pack(push, 1)
struct B{
    int b; //模数为4
    char a; //模数为1
}b;
//此时结构体变量b的长度就为5
#pragma pack(pop)

方式二:

  1. 先计算变量。根据对齐模数计算结构体变量中的起始地址,必须是对齐模数的整数倍,不是整数倍会自动补齐。
  2. 再计算结构体。根据结构体的对齐模数计算结构体的大小。结构体的对齐模数是#pragma pack定义的模数与结构体内部最大的基本数据类型成员长度中数值较小者。结构体的长度应该是该模数的整数倍。(但这里要注意如果有预处理指令定义时,变量的模数如果大于n,则按n的对齐规则)

按照这种方式:

struct A{
    short a; //模数为2
    int b; //模数为4
    char c; //模数为1
    double d; //模数为8
}a;

1.先计算结构体中成员的地址:

  a:地址为0,是其模数2的倍数,所以不再补齐。

  b:如果不对齐,则地址为2。不是模数的整数倍,应补齐2个空间(其实也就是方式一中的填充区),地址变成4。

  c:此时地址为8,是1的整数倍,不再补齐。

  d:如果不对齐,则地址为9。所以应补齐8个空间,地址变成16

此时结构体中成员占据的空间为24

通过打印地址也可验证:

2.计算结构体模数:

此时没有定义编译器指令,所以,结构体模数应该是其成员中最大占用空间类型的模数,也就是8,其大小为24,是8的倍数,所以结构体不再对齐。

对于这两种方式,我觉得方式二可能更好理解一些,但是要注意考虑到编译指令的问题,最后得出:

1.当没有定义编译指令n时:

  结构体长度= 结构体内成员对齐后占用的空间之和(两两对比);

  之后还需验证结构体地址是否是成员最强类型变量模数k的的整数倍。

2.当定义了编译指令n时:

  如果类型强度小于n那么还是按照成员的对齐规则。如果是大于n则需按照n的对齐规则。

  同样在之后还是要验证结构体地址是否是对齐模数的整数倍。如果不是,则结构体模数同样也要进行对齐。

时间: 2024-12-28 21:06:27

结构体struts的长度的相关文章

结构体最后的长度为0或1数组的作用--零长数组

其实很早在看LINUX下就看到这个东西,后来在李先静的<系统程序员成长计划>里看到了类似的定义,于是心里想着总结一下,结果发现网上已经有牛人总结的很好了,于是乎就转了过来,谢谢你们的分享,这是我前进的动力! 同时,需要引起注意的:ISO/IEC 9899-1999里面,这么写是非法的,这个仅仅是GNU C的扩展,gcc可以允许这一语法现象的存在.(C99允许.微软的VS系列报一个WARNING,即非常的标准扩展.) 结构体最后使用0或1的长度数组的原因,主要是为了方便的管理内存缓冲区,如果你直

C学习之结构体

结构体(struct) 结构体是由基本数据类型构成的.并用一个标识符来命名的各种变量的组合,结构体中可以使用不同的数据类型. 1. 结构体说明和结构体变量定义 在Turbo C中, 结构体也是一种数据类型, 可以使用结构体变量, 因此,  像其它类型的变量一样, 在使用结构体变量时要先对其定义. 定义结构体变量的一般格式为: struct 结构体名 { 类型  变量名; 类型  变量名; ... } 结构体变量; 结构体名是结构体的标识符不是变量名. 类型为第二节中所讲述的五种数据类型(整型.浮

柔性数组(结构体最后一个域为0/1数组)

结构体最后的长度为0或1数组的作用(转载) 2012-05-07 17:07:09 其实很 早在看LINUX下就看到这个东西,后来在MFC内存池里同样也看到了类似的东西,还依照MFC写过一个类似的小内存池,(MFC用的是return this + 1)后来在李先静的<系统程序员成长计划>里看到了类似的定义,于是心里想着总结一下,结果发现网上已经有牛人总结的很好了,于是乎就转了过来,谢谢你们 的分享,这是我前进的动力!同时,需要引起注意的:ISO/IEC 9899-1999里面,这么写是非法的,

程序设计基石与实践系列之失落的C语言结构体封装艺术

英文来源于 Eric S. Raymond-- The Lost Art of C Structure Packing 谁该阅读这篇文章 本文是关于削减C语言程序内存占用空间的一项技术--为了减小内存大小而手工重新封装C结构体声明.你需要C语言的基本知识来读懂本文. 如果你要为内存有限制的嵌入式系统.或者操作系统内核写代码,那么你需要懂这项技术.如果你在处理极大的应用程序数据集,以至于你的程序常常达到内存的界限时,这项技术是有帮助的.在任何你真的真的需要关注将高速缓存行未命中降到最低的应用程序里

Socket传输结构体数据注意事项

[1 背景] 在Socket通信中,要传输结构化的数据或者要进行协议数据传输的时候,发送端必须要构造结构体进行数据传输. 接收端也必须通过同样的结构体进行解析. 但Socket传输结构体数据时候,稍有不慎就会出现:1)解析数据出错:2)接收数据不完整:3)解析为乱码等的Bug. [2 举例] 如下是接收端解析数据为乱码甚至崩溃的一类常见错误. 结构体也就是一段连续的内存. 但是类似如下的结构体: typedef struct _PER_SPIDER_INFO { UINT nTimeDelay;

C++结构体中sizeof

说明: 结构体的sizeof值,并不是简单的将其中各元素所占字节相加,而是要考虑到存储空间的字节对齐问题.这些问题在平时编程的时候也确实不怎么用到,但在一些笔试面试题目中出是常常出现,一.解释 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐. 各个硬件平台对存储空间的处理上有很大的不同.一些平

(转)失落的C语言结构体封装艺术

目录1. 谁该阅读这篇文章 2. 我为什么写这篇文章 3.对齐要求 4.填充 5.结构体对齐及填充 6.结构体重排序 7.难以处理的标量的情况 8.可读性和缓存局部性 9.其他封装的技术 10.工具 11.证明及例外 12.版本履历 1. 谁该阅读这篇文章 本文是关于削减C语言程序内存占用空间的一项技术——为了减小内存大小而手工重新封装C结构体声明.你需要C语言的基本知识来读懂本文. 如果你要为内存有限制的嵌入式系统.或者操作系统内核写代码,那么你需要懂这项技术.如果你在处理极大的应用程序数据集

多文件调用(函数、结构体)

main.m文件 int main(int argc, const char * argv[]) { struct student stu1; struct student stu2 = {"李四",16,98};//////extern struct student stu3 = {"王五",21,99}; strcpy(stu1.name,"张三"); stu1.age = 17; stu1.grade = 96.5; struct stud

C#中结构体定义并转换字节数组

最近的项目在做socket通信报文解析的时候,用到了结构体与字节数组的转换:由于客户端采用C++开发,服务端采用C#开发,所以双方必须保证各自定义结构体成员类型和长度一致才能保证报文解析的正确性,这一点非常重要. 首先是结构体定义,一些基本的数据类型,C#与C++都是可以匹配的: [StructLayoutAttribute(LayoutKind.Sequential, CharSet = CharSet.Ansi, Pack = 1)] public struct Head { public