C++内存对齐方式

转自http://www.blogfshare.com/memory-alignment.html

一、什么是内存对齐、为什么需要内存对齐?

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

字,双字,和四字在自然边界上不需要在内存中对齐。(对字,双字,和四字来说,自然边界分别是偶数地址,可以被4整除的地址,和可以被8整除的地址。)
无论如何,为了提高程序的性能,数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;然而,对齐的内存访问仅需要一次访问。
某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐,这些指令将会产生一个通用保护异常。双四字的自然边界是能够被16整除的地址。其他的操作双四字的指令允许未对齐的访问(不会产生通用保护异常),然而,需要额外的内存总线周期来访问内存中未对齐的数据。

用术语来讲就是,基本C类型在X86和ARM上都是自对齐的(self-aligned)。指针,不管是32位(4字节)还是64位(8字节)也是自对齐的。
自对齐能存取得更快是因为它能用一条指令来存取该类型数据。 另一方面,如果没有对齐限制,代码可能会在跨机器字边界存取的时候使用两条以上的指令。字符是特殊情况: 不管它在们在机器字的哪个位置,存取代价都是一样的。所以它们没有对齐要求。

二、对齐规则
每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。
规则:
(1)数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行。
(2)结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
(3)当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。

三、填充(padding)

现在我们来看一个简单的例子,变量在内存中的分布。


1
2
3

char   *p; 
char   c; 
int   a;

如果你不知道数据对齐,你可能会假定这三个变量在内存里占用连续的字节。 即,在32位机器上4字节的指针后面会紧跟1字节的char,而它后面会紧跟4字节的int。在64位机器上,唯一的差别是指针是8字节的。

这是(在x86或ARM或任何自对齐的机器上)实际的情况:p 存储在4字节或8字节对齐的位置上(由机器的字长决定)。这是指针对齐-可能的最严格的情况。

c的存储紧跟着p。但a的4字节对齐要求造成一个缺口,就好像有第四个变量插入其中:


1
2
3
4

char   *p;    //4  或 8字节 
char   c;      //1 字节 
charpad[3];      //3 字节 
int   a;         //4 字节

charpad[3];         表示有3个字节浪费了。

如果a是2字节的short的话,这种情况内存分布是这样的:


1
2
3
4

char   *p;    //4  或 8字节 
char   c;      //1 字节 
charpad[1];      //1 字节 
short   a;         //2 字节

如果你想让这些变量占用较少的空间,你可以交换a和c的位置:


1
2
3

char   *p;    //4  或 8字节 
int   a;         //4 字节 
char   c;      //1 字节

四、结构体的对齐和填充

上面说到结构体实际会和它的最宽成员一样对齐,编译这样做因为这是保证所有成员自对齐获取快速存取的最容易方法。

看看这个结构:


1
2
3
4
5

struct user{
    char    *name;
    char      c;
    int         age;
};

假设是在32位机器上,内存分布是这样的:


1
2
3
4
5
6

struct user{
    char    *name;  //4  字节
    char      c;  //1 字节
    charpad[3];    //3 字节
    int         age;    //4 字节
};

这样的话sizeof(user)  为 12字节

那么如果我们交换c和age的位置。


1
2
3
4
5

struct user{
    char    *name;  //4  字节
    int         age;    //4 字节
    char      c;  //1 字节
};

你可能会认为sizeof(user)为9,但是这样 sizeof(user)  还是为 12字节。

因为struct是根据最宽的成员对齐,所以最后还是有3个字节填充但未使用。

struct  user  uu[4];

这样,在uu数组里,每个成员都有3字节的拖尾填充,因为下一个结构体的第一个成员需要在4字节边界上对齐。

现在让我们考虑位域(bitfields)。它们使得你能声明比字节宽度更小的成员,低至1位。


1
2
3
4
5
6
7

struct    st{ 
    short  s; 
    char  c; 
    int  flip:1; 
    int  nybble:4; 
    int  septet:7; 
};

从编译器的角度来看,struct   st里的位域就像2字节,16位的字符数组,只用到了12位。为了使结构体的长度是它的最宽成员长度(即sizeof(short))的整数倍,还有一个字节的填充:


1
2
3
4
5
6
7
8
9

struct    st{ 
    short  s;    //2个字节 
    char  c;     //1个字节 
    int  flip:1;    //总 1 bit 
    int  nybble:4;   //总  5  bits 
    int  septet:7;   //总  12 bits 
    int  pad:4;  //总16 bits 
    charpad;       //1个字节 
};

如果你的结构体中含有结构体,里面的结构体也要和最长的标量有相同的对齐。

五、结构成员重排

来看看32位系统下的这两种情况:


1
2
3
4
5
6
7
8
9
10
11
12
13

struct user{
    char  a;    //1字节 
    charpad[3];   //3字节
    int  c;      //4字节
    char  b;  //1字节
    charpad[3];   //3字节
};
struct user{
    int  c;      //4字节
    char  a;    //1字节 
    char  b;  //1字节
    charpad[2];   //2字节
};

上面结构成员都是一样,只是顺序不一样,但是大小前面一个是12字节,后面一个是8字节。

首先我们注意到溢出只发生在两个地方。 一个是较大的数据类型(从而需要更严格的对齐)跟在较小的数据后面。另一个是结构体自然结束的位置到跨步地址之间需要填充,以使下一个相同结构能正确地对齐。最简单的消除溢出的方式是按对齐值的递减来排序成员。


1
2
3
4
5

union    u{
    char a;
    int b;
    long double c;
};   //大小为8字节  32位

struct/class/union内存对齐原则都是一样的。

本文链接:http://www.blogfshare.com/memory-alignment.html

时间: 2024-10-11 05:41:53

C++内存对齐方式的相关文章

<转> Struct 和 Union区别 以及 对内存对齐方式的说明

转载地址:http://blog.csdn.net/firefly_2002/article/details/7954458 一.Struct 和 Union有下列区别: 1.在存储多个成员信息时,编译器会自动给struct第个成员分配存储空间,struct 可以存储多个成员信息,而Union每个成员会用同一个存储空间,只能存储最后一个成员的信息. 2.都是由多个不同的数据类型成员组成,但在任何同一时刻,Union只存放了一个被先选中的成员,而结构体的所有成员都存在. 3.对于Union的不同成

C#调用C++ 平台调用P/Invoke 结构体--内存对齐方式、union封装【七】

[1]内存对齐方式 C++代码: #pragma pack(push) #pragma pack(1) typedef struct _testStru2 { int iVal; char cVal; __int64 llVal; }testStru2; #pragma pack(pop) EXPORTDLL_API void Struct_PackN( testStru2 *pStru ) { if (NULL == pStru) { return; } pStru->iVal = 1; pS

内存对齐方式

示例1: <span style="font-size:18px;">#include <iostream> using namespace std; struct Node1{ bool m1; int m2; bool m3; double m4; bool m5; }; // struct Node2{ // char m1; // char m2; // int m3; // }; int main() { cout << sizeof(No

C语言中内存对齐方式

position:static(静态定位) 当position属性定义为static时,可以将元素定义为静态位置,所谓静态位置就是各个元素在HTML文档流中应有的位置 podisition定位问题.所以当没有定义position属性时,并不说明该元素没有自己的位置,它会遵循默认显示为静态位置,在静态定位状态下无法通过坐标值(top,left,right,bottom)来改变它的位置. position:absolute(绝对定位) 当position属性定义为absolute时,元素会脱离文档流

windows和Linux内存的对齐方式

一.内存对齐的初步讲解 内存对齐可以用一句话来概括: "数据项只能存储在地址是数据项大小的整数倍的内存位置上" 例如int类型占用4个字节,地址只能在0,4,8等位置上. 例1: #include <stdio.h> struct xx{ char b; int a; int c; char d; }; int main() { struct xx bb; printf("&a = %p\n", &bb.a); printf("

内存对齐分配策略(含位域模式)

1. 内存对齐定义 现在使用的计算机中内存空间都是按照字节划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但是实际上计算机系统对于基本数据类型在内存中的存放位置都有限制,要求这些数据存储首地址是某个数K的倍数,这样各种基本数据类型在内存冲就是按照一定的规则排列的,而不是一个紧挨着一个排放,这就是内存对齐. 对齐模数 内存对齐中指定的对齐数值K成为对齐模数(Alignment Modulus).当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数,我们就称类型S的对齐

内存补齐序列一:关于内存对齐和填充

这个问题困扰许久,查了许多资料,网上众说纷纭,整理如下: 对于内存补齐的详细情况,请关注下一篇:C/C++ 内存补齐机制 一.内存对齐的初步讲解 内存对齐可以用一句话来概括: "数据项只能存储在地址是数据项大小的整数倍的内存位置上(分别为偶地址.被4整除的地址.被8整除的地址 )" 例如int类型占用4个字节,地址只能在0,4,8等位置上. 例1: #include <stdio.h> struct xx{ char b; int a; int c; char d; };

内存对齐与自定义类型

一.内存对齐 (一).为什么会有内存对齐? 1.为了提高程序的性能,数据结构(尤其是栈)应该尽可能的在自然边界上对齐.原因是为了访问未对齐的内存,处理器需要进行两次访问,而访问对齐的内存,只需要一次就够了.这种方式称作"以空间换时间"在很多对时间复杂度有要求问题中,会采用这种方法. 2.内存对齐能够增加程序的可移植性,因为不是所有的平台都能随意的访问内存,有些平台只能在特定的地址处处读取内存. 一般情况下内存对齐是编译器的事情,我们不需要考虑,但有些问题还是需要考虑的,毕竟c/c++是

内存对齐,大端字节 &nbsp; 序小端字节序验证

空结构体:对于空结构体,就是只有结构体这个模子,但里面却没有元素的结构体. 例: typedef struct student { }std: 这种空结构体的模子占一个字节,sizeof(std)=1. 柔性数组: 结构体中最后一个元素可以是一个大小未知的数组,称作柔性数组成员,规定柔性数组前面至少有一个元素. typedef struct student { int i; char arr[];     //柔性数组成员 }std: sizeof(std)=4; sizeof求取该结构体大小是