为什么要求内存对齐

  说到内存对齐,很多人都知道是怎么回事。但是问过一些人,为什么要求内存对齐?基本上的答案都是节约内存。

  但是很明显,这个答案是错误的。要求内存对齐是因为CPU访问某个数据时,要求其存储地址必须是相应数据类型的自然边界。对于不对齐的数据,不支持非对齐数据访问的CPU,会导致CPU异常;即使是支持非对齐数据访问的CPU,也会严重影响程序效率。

  假设非对齐访问出现在位于操作系统之上的进程,且CPU不支持非对齐数据访问,那么对于出现CPU异常的情况,可能操作系统会对其进行处理,(1)将所需要的数据装载,并返回,或者说(2)直接让进程死掉。情形(2)不需要多做解释;对情况(1)来说,非对齐访问每次都要进入异常处理程序,相比于一条指令直接拿到数据,效率严重低下。

  假设非对齐访问出现在直接位于硬件之上的进程,且CPU不支持非对齐数据访问,那么对于出现CPU异常的情况来说,基本上的直观反应是进程退出并出现堆栈信息。

  接下来进一步对非对齐数据装载进行分析。

如下图,|-|表示自然边界,假设存在两个连续的位于自然边界上的64位数据,当CPU访问它们中的任何一个的时候,可以一条LD指令就能完成加载

  |-|BBBBBBBB|-|BBBBBBBB

现在假设有一个8字节数据如下,|表示数据开始位置,|-|表示自然边界

  |-|BBBBB|BBB|-|BBBBB|BBB

其前三字节为前一个对齐的八字节数据的后三字节,其后五字节为后一个对齐的八字节数据的前五字节

  对于不支持非对齐装载指令的CPU来说,要装载这样的一个数据,需要先装载前一个八字节数据,再装载后一个八字节数据,然后将前一个八字节数据的后三字节与后一个八字节数据的前五字节数据合并才能得到结果,与对齐数据的访问相比,多了一个装载指令以及相关合并指令的开销,一般来说,在忽视缓存未命中的情况下,装载指令的执行与得到结果之间是存在额外开销的,因此这个差别是很大的,何况上边说的,假设是在操作系统对CPU异常进行处理时为其加载数据,那么异常处理程序的开销可能更大;对非对齐数据的写入时也需要额外的加载,合并操作。

  即使对于支持非对齐数据加载的CPU,依然会极大的影响效率,差别只是它省略掉了CPU异常处理过程。

  再进一层,假设之前描述的非对齐数据刚好横跨两个cache line,而且这两个cache line至少有一个不在cache中(虽然对齐数据也会存在未命中,但是与非对齐相比,它不会横跨两个cache line),那么这个访问效率绝对不是多几十条指令的问题了。

  因此,内存不对齐的坏处不是浪费内存,因为即使我写一个随便在不同位置放置不同大小的数据时,只要告诉编译器说必须按照一字节对齐,编译器编译时肯定按照我的意愿不浪费一个字节的内存。编译器默认按照自然边界对齐,是因为它要求效率,保证程序的正常运行(因为非对齐访问可能导致进程退出)。我们对结构体的组织的调整是为了节约内存,而调整的规则就是按照内存对齐来安插数据。

时间: 2024-12-21 09:17:01

为什么要求内存对齐的相关文章

内存对齐与自定义类型

一.内存对齐 (一).为什么会有内存对齐? 1.为了提高程序的性能,数据结构(尤其是栈)应该尽可能的在自然边界上对齐.原因是为了访问未对齐的内存,处理器需要进行两次访问,而访问对齐的内存,只需要一次就够了.这种方式称作"以空间换时间"在很多对时间复杂度有要求问题中,会采用这种方法. 2.内存对齐能够增加程序的可移植性,因为不是所有的平台都能随意的访问内存,有些平台只能在特定的地址处处读取内存. 一般情况下内存对齐是编译器的事情,我们不需要考虑,但有些问题还是需要考虑的,毕竟c/c++是

内存对齐,大端字节   序小端字节序验证

空结构体:对于空结构体,就是只有结构体这个模子,但里面却没有元素的结构体. 例: typedef struct student { }std: 这种空结构体的模子占一个字节,sizeof(std)=1. 柔性数组: 结构体中最后一个元素可以是一个大小未知的数组,称作柔性数组成员,规定柔性数组前面至少有一个元素. typedef struct student { int i; char arr[];     //柔性数组成员 }std: sizeof(std)=4; sizeof求取该结构体大小是

20160402_C++中的内存对齐

原题: 有一个如下的结构体: struct A{  long a1;  short a2;  int a3;  int *a4; }; 请问在64位编译器下用sizeof(struct A)计算出的大小是多少? 答案:24 -------------------------------------------------------------------------------- 本题知识点:C/C++ 预备知识:基本类型占用字节 在32位操作系统和64位操作系统上,基本数据类型分别占多少字节

内存对齐

有虚函数的话就有虚表,虚表保存虚函数地址,一个地址占用的长度根据编译器不同有可能不同,vs里面是8个字节,在devc++里面是4个字节.类和结构体的对齐方式相同,有两条规则1.数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行.2.结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照

内存对齐和大小端

一.内存对齐的原因 根本原因:cpu是根据内存访问粒度(memory access granularity,下文简写成MAG)来读取内存,MAG就是cpu一次内存访问操作的数据量,具体数值依赖于特定的平台,一般是2byte.4byte.8byte. 内存对齐:更够减少内存读取次数(相对于内存不对齐),为了访问未对齐的内存,处理器需要作两次内存访问:而对齐的内存访问仅需要一次访问. 二.内存对齐的步骤 每个平台上的编译器都有自己的默认“对齐系数”.同时,我们也可以通过预编译命令#pragma pa

关于内存对齐的那些事

Wrote by mutouyun. (http://darkc.at/about-data-structure-alignment/) 1. 内存对齐(Data Structure Alignment)是什么 内存对齐,或者说字节对齐,是一个数据类型所能存放的内存地址的属性(Alignment is a property of a memory address). 这个属性是一个无符号整数,并且这个整数必须是2的N次方(1.2.4.8.--.1024.--). 当我们说,一个数据类型的内存对齐

c++编程思想(三)--c++中c 续,重点sizeof和内存对齐

之前理论性的太多,下面就是代码及理论结合了 1.sizeof()是一个独立运算符,并不是函数,可以让我们知道任何变量字节数,可以顺带学一下struct,union,内存对齐 内存对齐:为了机器指令快速指向地址值,编译器内部实际上会内存对齐,怎么理解了,以struct为例 先讲一下各个变量类型内存大小 所以struct理论上是:1+2+4+4+4+8+8 = 31,但是实际是 实际大小是32(1+2+1+4)+(4+4)+8+8 然后再把int和short位置调换 实际大小是40   (1+3)+

struct内存对齐1:gcc与VC的差别

struct内存对齐:gcc与VC的差别 内存对齐是编译器为了便于CPU快速访问而采用的一项技术,对于不同的编译器有不同的处理方法. Win32平台下的微软VC编译器在默认情况下采用如下的对齐规则: 任何基本数据类型T的对齐模数就是T的大小,即sizeof(T).比如对于double类型(8字节),就要求该类型数据的地址总是8的倍数,而char类型数据(1字节)则可以从任何一个地址开始.Linux下的GCC奉行的是另外一套规则:任何2字节大小(包括单字节吗?)的数据类型(比如short)的对齐模

c++中类对象的内存对齐

很多C++书籍中都介绍过,一个Class对象需要占用多大的内存空间.最权威的结论是: *非静态成员变量总合.(not static) *加上编译器为了CPU计算,作出的数据对齐处理.(c语言中面试中经常会碰到内存对齐的问题) *加上为了支持虚函数(virtual function),产生的额外负担. 下面给出几个程序来看一下: #include <iostream> #include <cstdio> #include <string> using namespace

C语言内存对齐

C语言的内存对齐什么是内存对齐?为什么要内存对齐?如何行内存对齐?内存对齐是指:数据在内存里放的数据,不是紧密的放在一起,而是按照一定的规则存放.为什么要内存对齐:在32的cpu上,每条指令可以读取32位(4个字节的值),内存对齐是为了保证一次指令可以读到一个完整的数据,减少数据的拼合耗费.如下举例:struct A{ char a; int b;}temp;则temp在内存中的存储是第一种方式(只是为了举例说明,并非实际的内存): |a | 空     |   b       |-------