C++中的字节对齐分析

struct A
{
    int a;
    char b;
    short c;
};

struct B
{
    char a;
    int b;
    short c;
};

#pragma pack(2)
struct C
{
    char a;
    int b;
    short c;
};

#pragma pack(1)
struct D
{
    int a;
    char b;
    short c;
};

int _tmain(int argc, _TCHAR* argv[])
{

    cout << sizeof(A) << "   "<< sizeof B << "   "<< sizeof C << "   "<< sizeof D <<endl;
    return 0;
}

  运行结果如下:

8     12     8       7

  理论上来说,结构体A与B的大小应该都是一样的,造成这种原因的就是字节对齐引起来的。

2.为什么要字节对齐  

  为什么呢?简单点说:为了提高存取效率。字节是内存空间分配的最小单位, 在程序中,我们定义的变量可以放在任何位置。其实不同架构 的CPU在访问特定类型变量时是有规律的,比如有的CPU访问int型变量时,会从偶数地址开始读取的,int类型占用4个字节(windows平台)。 0X0000,0X0004,0X0008.....这样只需要读一次就可以读出Int类型变量的值。相反地,则需要读取二次,再把高低字节相拼才能得到 int类型的值,这样子看的话,存取效率当然提高了。  通常写程序的时候,不需要考虑这些情况,编译都会为我们考虑这些情况,除非针对那些特别架构的 CPU编程的时候的则需要考虑 。当然用户也可以手工控制对齐方式。

3.编译器对字节对齐的一些规则

  我从下面三条说明了编译器对字节处理的一些原则。当然除了一些特殊的编译器在处理字节对齐的方式也不一样, 这些情况我未碰到过,就不作说明了。

  a. 关于数据类型自身的对齐值,不同类型会按不同的字节来对齐。

类型 对齐值(字节)
char 1
short 2
int 4
float 4
double 4

b. 类、结构体的自身对齐字节值。对于结构体类型与类对象的对齐原则:使用成员当中最大的对齐字节来对齐。比如在Struct A中,int a的对齐字节为4,比char,short都大,所以A的对齐字节为4

c. 指定对齐字节值。意思是指使用了宏 #pragma pack(n)来指定的对齐值

d. 类、结构及成员的有效对齐字节值。有效对齐值=min(类/结构体/成员的自身对齐字节值,指定对齐字节值)。   

  有效对齐值决定了数据的存放方 式,sizeof 运算符就是根据有效对齐值来计算成员大小的。简单来说, 有效对齐其实就是要求数据成员存放的地址值能被有效对齐值整除,即:地址值%有效对齐值=0

4. 结合编译器分析示例

根据上面的原则,分析Struct A的size。结构体的成员内存分配是按照定义的顺序来分析的。

struct A
{    
   int a;    
   char b;    
   short c;
}

为了简单起见, 我假设Struct A存取的起始地址为 0x0000 在没有指定对齐值的情况下,分析步骤:  

step 1: 根据第二条,首先为结构体选择对齐值:选择成员中最大的对齐值,即int a,对齐值为4
      
   step 2: 再根据第四条原则,决定有效对齐值:即然没有手工指定对齐值,则使用默认的值:4(windows 32平台)   

step 3: int a 的有效地址值=min(4,4),(因为0x0000%4=0),这样a的地址就是从 0X0000~0x0003    

step 4: char b 的有效对齐值=min(1,4),地址依次从0x0004 (因为Ox0004%1=0)开始,分配一个字节,地址段分配情况就是:0x0000~0x0004    

step 5: short c 的有效对齐值=min(2,4),理论上说,分配的地址应该是连续的(从0x0005~0x00006),但是由于要求考虑到对齐的情况,所求要求地址段 偏移,这样就从0x0006(Offset+1,因为0x0006%2=0)开始,分配2个字节的地址0x0006~0x0007.

目前为止,地址段的分配情况就是:0x0000~0x0007这样sizeof(A)的大小=0x0000~0x0007共8个字节大小,同时,8%4=0保证了Struct A的地址段与4成偶数倍。

接下来分析Struct B的大小,同样假设Struct B的起始地址为0x0000,分析步骤如下:

struct B
{
    char a;
    int b;
    short c;
}

step 1: 确实结构体B对齐值:选择成员中最大的对齐值,即int a,对齐值为4
      
   step 2: 确定手工指定对齐值,使用默认的值:4(windows 32, VC6.0平台)   

step 3: char a 的有效地址值=min(1,4),a的地址就是 0X0000(因为0x0000%1=0)   

step 4: int b 的有效对齐值=min(4,4),地址依次从0x0004~0x0007 (因为Ox0004%1=0)开始,分配4个字节,目前j地址段分配情况就是:0x0000~0x0007    

step 5: short c 的有效对齐值=min(2,4),c从0x0008~0x0009(因为0x0008%2=0)开始,偏移2个字节的地址0x0006~0x0007.
    
    至止,地址段的分配情况就是:0x0000~0x0009共10个字节,但是Struct B的对齐值为4,这就要求地址地段再偏移2个字节,这样就是从0x0000~0x000B共12(因为12%4=0)个字节大小。这样,sizeof(B)=12

再来使用Pragma手工更改了字节对齐值的情况,先看看Struct C的定义:

#pragma pack(2)
struct C
{
    char a;
    int b;
    short c;
};

在代码中,手工指定了对齐值为2个字节,分析步骤如下:

step 1: 确定结构体C对齐值:选择成员中最大的对齐值,即int a,对齐值为4
      
   step 2: 确定手工指定对齐值,使用手工指定的值:2

step 3: char a 的有效地址值=min(1,2),(因为0x0000%2=0),这样a的地址就是0x0000 

step 4: int b 的有效对齐值=min(4,2),地址依次从0x0002~0x0005 (因为Ox0002%2=0)开始,分配4个字节,目前地址段分配情况就是:0x0000~0x0005    

step 5: short c 的有效对齐值=min(2,2),由于要求考虑到对齐的情况,从0x0006(因为0x0006%2=0)开始,分配2个字节的地址0x0006~0x0007

目前为止,地址段的分配情况就是:0x0000~0x0007共8个字节,同时也保证了Struct C的对齐情况(2字节对齐,pragma(2)),sizeof(C)=8

请注意这种情况与Struct B的情况有区别,B的sizeof大小为12个字节,C的sizeof大小为8个字节。

最后分析#pragma pack(1)这种情况,这种情况非常简单,对齐值为1,因为1可以被任何数据整除,所以Struct D的成员变量存取顺序是连续的,这样就好办了,sizeof(D)=sizeof(int)+sizeof(char)+sizeof(short)=4+1+2=7 (比如从0x0000~0x0006)

总结

  在考虑字节对齐时要细心,搞清楚几个重要的概念,如类型自身对齐值,手工对齐值以及有效对齐值,有效对齐值决定了最后的存取方式,有效对齐值等于类型自身对齐值与手工对齐值中较小的一个。理解了这一点,对sizeof运算符对类型或都结构的运算也彻底明白了。

【转自】http://www.cnblogs.com/repository/archive/2011/01/13/1933721.html

时间: 2024-10-14 18:11:14

C++中的字节对齐分析的相关文章

bmp图像存储中的字节对齐问题

1. bmp数据对齐问题. 假设所读取的bmp图片位数是24,图像高度和宽度分别为998像素和726像素,每个像素占3个字节,即每行像素占3*726个字节,不是4的整数倍,首先需要对每行字节进行补零操作.假设文件头和信息头分别为bfh和bih,则每行所补的字节数为: offset_bytes = 4 - (bih.biWidth * bih.biBitCount/8)%4 补齐后每行所占的字节数为: row_length = 4*((bih.biWidth * bih.biBitCount +

C语言中的字节对齐以及其相关处理

首先,我们来了解下一些基本原理: 一.什么是字节对齐一个基本类型的变量在内存中占用n个字节,则该变量的起始地址必须能够被n整除,即: 存放起始地址 % n = 0,那么,就成该变量是字节对齐的;对于结构体.联合体而言,这个n取其所有基本类型的成员中占用空间字节数最大的那个;内存空间是以字节为基本单位进行划分的,从理论上讲,似乎对任何类型的变量的访问都可以从任何地址处开始,但实际情况是在访问特定类型变量的时候经常是从特定的内存地址处开始访问,这就需要各种类型的数据只能按照一定的规则在空间上排列,而

C++中的字节对齐

本博客(http://blog.csdn.net/livelylittlefish)贴出作者(三二一.小鱼)相关研究.学习内容所做的笔记,欢迎广大朋友指正! 字节对齐 1. 基本概念字节对齐:计算机存储系统中以Byte为单位存储数据,不同数据类型所占的空间不同,如:整型(int)数据占4个字节,字符型(char)数据占一个字节,短整型(short)数据占两个字节,等等.计算机为了高速的读写数据,默认情况下将数据存放在某个地址的起始位置,如:整型数据(int)默认存储在地址能被4整除的起始位置,字

c/c++中的字节对齐

参加了很多面试,遇到字节对齐的问题不是1次2次,但一直没有彻底弄明白是什么意思,清明节刚好闲下来,彻底研究了一下,得到下面的结论,希望对以后的面试和工作有作用: 第一种结论: 首先提出几个概念 ①基本类型:像int,char,float,double之类的基本类型 ②复合类型:结构体,类,联合体之类的类型,由基本类型构成 ③数据类型的宽度: 用sizeof (type)计算出来的宽度,一般int为4 Bytes,char为1 Byte... ④有效对齐模数N: 编译器默认对齐模数为M,M可以用#

ACE的CDR中的字节对齐问题

大家应该都知道计算机中间都有字节对齐问题.CPU访问内存的时候,如果从特定的地址开始访问一般可以加快速度,比如在32位机器上,如果一个32位的整数被放在能被32模除等于0的地址上,只需要访问一次,而如果不在,可能要访问两次.但是这样就要求一些数据从特定的地址开始,而不是顺序排放(中间会有一些空余的地址),这就是字节对齐. 而ACE CDR的估计也是为了加快速度,从而在CDR编码上默认也使用了字节对齐.所以在ACE的CDR编解码过程中,传入的参数地址最好是能符合字节对齐规则,否则可能会编解码错误.

嵌入式Linux C语言(六)——内存字节对齐

嵌入式Linux C语言(六)--内存字节对齐 一.内存字节对齐简介 1.内存字节对齐 计算机中内存空间都是按照字节划分的,从理论上讲对任何类型的变量的访问可以从任何地址开始,但是在程序实际编译过程中,编译器会对数据类型在编译过程中进行优化对齐,编译器会将各种类型数据按照一定的规则在空间上排列,而不是顺序的排放,这就是内存字节对齐. 2.内存字节对齐原因 不同硬件平台对存储空间的处理是不同的.一些平台对某些特定类型的数据只能从某些特定地址开始存取.比如某些架构的CPU在访问一个没有进行对齐的变量

c++内存中字节对齐问题详解

一.介绍 什么是字节对齐 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐. 字节对齐的原因和作用 各个硬件平台对存储空间的处理上有很大的不同.一些平台对某些特定类型的数据只能从某些特定地址开始存取.比如有些架构的CPU在访问 一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字

c++内存中字节对齐问题详解[转载]

一.什么是字节对齐,为什么要对齐?     现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐.     对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同.一些平台对某些特定类型的数据只能从某些特定地址开始存取.比如有些架构的CPU在访问 一个没有进行对齐的变量的时候会发生错误,那么在

stm32中字节对齐问题

ARM下的对齐处理   from DUI0067D_ADS1_2_CompLib 3.13 type  qulifiers 有部分摘自ARM编译器文档对齐部分  对齐的使用:  1.__align(num)     这个用于修改最高级别对象的字节边界.在汇编中使用LDRD或者STRD时     就要用到此命令__align(8)进行修饰限制,来保证数据对象是相应对齐.     这个修饰对象的命令最大是8个字节限制,可以让2字节的对象进行4字节     对齐,但是不能让4字节的对象2字节对齐.