C++字节对齐问题

关于C++字节对齐问题

关于C/C++的字节对齐

这两天写解析SWF文件的程序,在结构体指针和从文件里读出来的进行转换的时候遇到一些问题,就是有一个struct A,比如:

struct A

{

char flag;

int length;

int id;

....

};

然后一个飘逸的 struct A *a = (struct A*)buffer;   // 世界一下清静咯

可惜在输出a中的成员的时候却发现老是不对,百思不得起解。今晚一想,可能是因为C++的字节对齐问题,所以直接就百度了一些

C++的字节对齐。看到以下这篇文章说的挺清晰的,就转了过来。

________________________________________________________________________________________________________

关于C/C++的字节对齐

近期研究C++的数据类型和数据大小时发现,字节对齐实际上是一个C/C++程序猿无法忽视的一个问题.所以进行了初步的研究.

1.为什么会出现内存对齐问题-从x86 CPU架构说起

相信绝大多数计算机系和软件学院的学生都学过计算机组成原理这门基础课程,所以不作入门引导了,没有相关背景的能够补补相关课程资料.常有人问我,既然是按字节寻址方式,为何会出现字节对齐问题呢?难道是内存不是连续的吗?

这个问题实际上和CPU与内存的连接方式有关,我们知道CPU会通过地址总线Address BUS与CPU连接用于寻址,用Data
Bus数据总线连接用于获取数据,而内存一般是RAM构成的复杂阵列。

对于这个RAM阵列(实际内存可能更复杂,可是原理类似),
前16个内存地址排列相应内存单元关系例如以下:




对比上图,是不是发现,对于每一个内存操作周期,每一个地址实际上能够读取4个bytes的数据呢,那么如果你有一个int型的数据存储在地址1或者2或者
3,那么,是不是一个CPU内存时钟周期不够取出这个数据呢?这样是不是效率会非常低下?这也就是为什么我们须要内存对齐了,尽管现代CPU和编译器已经对
此做了非常多优化,可是C/C++因为特殊性,程序猿必须了解这个细节.

2.C/C++内存对齐的方式

C/C++中的结构/类的成员变量在对齐在内存中的排列是与它们摆放的先后顺序相关的,先看看以下的结构

1 struct malign_a
2 {

3    char a;

4    short b;

5    char c;

6    int d;
7 };

这个结构的sizeof(malign_a)是多少呢?1+2+1+4 =8?吗?这个实际上不正确,那么,怎样对齐的呢?

因为char是1个byte,所以无论他在什么位置,都能够用一个内存周期读出数据,short是半个字也就是2
bytes,这个时候假如它的地址是某个边界位置上,那么,也须要两个内存周期来读取,以此类推.所以,内存对齐就是增加填充padding无意义的数据
来保证某个数据位于一个能够通过最少内存周期的位置,比方double型仅仅有地址位于%4等于0的位置,才干保证2个周期读出.

同一时候对于每一个详细平台,不同的编译器有不同的指定的对齐模式,比方C/C++能够通过

1 #pragma
pack(n) //n为1,2,4,8,16等

来指定对齐.当然,一般x86 32位机器下,都是默认4字节对齐的.这个n也称为对齐模数.

对齐策略例如以下:

1.结构体成员对齐:按某成员数据本身大小以及指定大小中较小者对齐
2.结构体总体对齐:按全部成员中最大者和对齐模数中较小者对齐

所以上述结构体按默认对齐方式例如以下:

1.a是char类型,能够在任何位置,位于位置0

2.b是short类型,2比默认的4小,所以按2字节对齐,所以在a后面填充1个字节,b必须位于位置2,占两个字节
3.c是char类型,位于位置4

4.d是int类型,4<=4,所以按4字节对齐,须要在c后面填充3个字节,位置为8

5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为12



再把原来的结构体成员位置修改一下:

1 struct malign_b
2 {

3    char a;

4    char c;

5    short b;

6    int d;
7 };

这个结构的大小为8,对齐步骤例如以下:

1.a是char类型,能够在任何位置,位于位置0
2.c是char类型,位于位置1

3.b是short类型,2比默认的4小,所以按2字节对齐,这时候恰好位于位置2
4.d是int类型,4
5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为8



最后为了加深理解,我们来看看以下这个结构按对齐模数2对齐时候的memory layout

01 #pragma pack(push)

02 #pragma pack(2)
03 struct malign_b
04 {

05    char a;

06    int d;

07    char c;

08    short b;
09 };
10 #pragma
pack(pop)

它的大小为10,当指定为对齐模数2时候

1.因为a是char,1<2,位于位置0

2.因为d是int,4>2,所以按2字节对齐,所以必须在a后面填充一个字节,位于位置2,
3.c是char,位置为6

4.b是short,所以必须在c后面填充一个字节,位置为8
5.最大的是4,所以按2对齐,上述结果事实上已经总体是按2对齐,所以总数为10

我相信通过以上样例,应该能够熟悉字节对齐过程了,假设有不妥之处,敬请留言指出,谢谢.
原文链接:http://www.cnblogs.com/shihao/archive/2012/01/18/2325580.html

C++字节对齐问题,布布扣,bubuko.com

时间: 2024-10-12 13:05:25

C++字节对齐问题的相关文章

stm32中字节对齐问题

ARM下的对齐处理   from DUI0067D_ADS1_2_CompLib 3.13 type  qulifiers 有部分摘自ARM编译器文档对齐部分  对齐的使用:  1.__align(num)     这个用于修改最高级别对象的字节边界.在汇编中使用LDRD或者STRD时     就要用到此命令__align(8)进行修饰限制,来保证数据对象是相应对齐.     这个修饰对象的命令最大是8个字节限制,可以让2字节的对象进行4字节     对齐,但是不能让4字节的对象2字节对齐.  

字节对齐

今天我们总结在C++和C语言中让我们头疼的字节对齐问题: 一.首先来看什么是字节对其? 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任 何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐. 二: 那么问题就来了为什么要字节对其?以及字节对其的作用? 各个硬件平台对存储空间的处理上有很大的不同.一些平台对某些特定类型的数据只能从某些特定地址开始存

C语言:内存字节对齐详解[转载]

一.什么是对齐,以及为什么要对齐: 1. 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐. 2. 对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同.一些平台对某些特定类型的数据只能从某些特定地址开始存取.其他平台可能没有这种情况, 但是最常见的是如果不按照适合其平台的要求对数据存放进行对齐

结构体字节对齐问题(转)

原文出处:http://wenku.baidu.com/view/019e26b765ce0508763213e2.html 初学C,对结构体的使用sizeof计算所占字节数不是很明白,看了此篇文章,终于豁然开朗,转载过来,方便以后温故. #include<stdio.h> struct a {   char no[10];   int p;   long int pp;   unsigned int ppp;   char x;   float y;   double h; }xy; voi

关于C/C++的字节对齐

为什么要字节对齐呢?这要从计算机的结构说起,我们知道,在C/C++中定义的变量有单字节(char),双字节(short),四字节(int,float),八字节(long),但是CPU并不一个字节一个字节来读取处理的(8位单片机除外哈),目前常见的CPU都是32位甚至64位,这意味着CPU一次要读取4个字节或者8个字节,并且不能从任意地址开始读取,只能从地址是4或8的倍数地方开始.所以,要是一个int型数据正好被4或8的倍数分成两块呢,那CPU只能分两次来读,效率当然降低了,而如果浪费点内存,把c

结构体字节对齐

结构体字节对齐 在用sizeof运算符求算某结构体所占空间时,并不是简单地将结构体中所有元素各自占的空间相加,这里涉及到内存字节对齐的问题.从理论上讲,对于任何 变量的访问都可以从任何地址开始访问,但是事实上不是如此,实际上访问特定类型的变量只能在特定的地址访问,这就需要各个变量在空间上按一定的规则排列, 而不是简单地顺序排列,这就是内存对齐. 内存对齐的原因: 1)某些平台只能在特定的地址处访问特定类型的数据: 2)提高存取数据的速度.比如有的平台每次都是从偶地址处读取数据,对于一个int型的

C/C++中避免系统的字节对齐

在定义了一个新的Struct后. 系统会按照一定的规则将新生命的类型变量进行字节对齐,如下结构体: typedef struct Test{ int a; char b[6]; }Test; 该结构体类型可能会被对齐为12个字节. 那么,在内存流和文件流操作中可能会出现这样的用法: fwrite(strPtr,1,sizeof(Test)*len,fp); 事实上,被写入了len*12个字节,因为sizeof(Test)实际上不等于10,而是12. 那么,如下简单地操作可以避免在流操作中出现的一

内存字节对齐

写出一个struct,然后sizeof,你会不会经常对结果感到奇怪?sizeof的结果往往都比你声明的变量总长度要大,这是怎么回事呢?讲讲字节对齐吧 1:数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如说是数组,结构体等)的整数倍开始(比如int在32位机为4字节,则要从4的整数倍地址开始存储. 2:结构体作为成员:如果一个结构里有某些结构

字节对齐问题

文章最后本人做了一幅图,一看就明白了,这个问题网上讲的不少,但是都没有把问题说透. 32位机器上各种数据类型的长度如下:char:1(有符号无符号同) short:2(有符号无符号同) int:4(有符号无符号同) long:4(有符号无符号同) float:4 double:8 一.概念    对齐跟数据在内存中的位置有关.如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐.比如在32位cpu下,假设一个整型变量的地址为0x00000004,那它就是自然对齐的.   二.为什么要

C语言字节对齐 __align(),__attribute((aligned (n))),#pragma pack(n)

转载地址 : http://blog.csdn.net/21aspnet/article/details/6729724 一.概念    对齐跟数据在内存中的位置有关.如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐.比如在32位cpu下,假设一个整型变量的地址为0x00000004,那它就是自然对齐的.   二.为什么要字节对齐   需要字节对齐的根本原因在于CPU访问数据的效率问题.假设上面整型变量的地址不是自然对齐,比如为0x00000002,则CPU如果取它的值的话需要访