c/c++深入篇之内存分配与内存对齐的探讨



不明白内存分配和指针的可以看看,其实这本是我们老师留的一个操作系统科技小论文作业,不知道写什么,干脆把以前收藏的经典C内存分配的文章整理并修改了一下。       此文章有2个用处,1:这是个小论文,格式完整,大家可以复制回去交作业;2:这是整理的经典C内存分配小教程(也加了些我自己的观点),不明白内存分配的可以看看。

还有很重要的一个问题:      这篇文章引用的很多内容我也不知道究竟是出自谁手,知道作者是谁的麻烦告诉下,我好谢谢他。(记得都是csdn里面找的)

tag: 操作系统 论文 内存分配 内存对齐 c语言内存分配 免费论文下载.doc

正文:

关于程序设计的内存分配问题

freec

(辽宁工程技术大学
软件学院
计SJ07-3
辽宁
葫芦岛
125000)

[摘 
要]

在大多数低层程序设计中,由于内存分配与内存对齐问题所带来的bug所占比重非常大。本文对内存分配中的分配空间类型、作用、方法、适用范围、优缺点以及内存对齐问题中的对齐原因、对齐规则等进行了详细的说明,并结合大量c语言代码进行阐述与分析。

[关键词]

内存分配;堆栈原理;内存对齐;

1
引言

操作系统的内存分配问题与内存对齐问题对于低层程序设计来说是非常重要的,对内存分配的理解直接影响到代码质量、正确率、效率以及程序员对内存使用情况、溢出、泄露等的判断力。而内存对齐是常常被忽略的问题,理解内存对齐原理及方法则有助于帮助程序员判断访问非法内存。

2
程序的内存分配问题

一、一般C/C++程序占用的内存主要分为5种

1、栈区(stack):类似于堆栈,由程序自动创建、自动释放。函数参数、局部变量以及返回点等信息都存于其中。

2、堆区(heap):
使用自由,不需预先确定大小。多数情况下需要由程序员手动申请、释放。如不释放,程序结束后由操作系统垃圾回收机制收回。

3、全局区/静态区(static):全局变量和静态变量的存储是区域。程序结束后由系统释放。

4、文字常量区:常量字符串就是放在这里的。
程序结束后由系统释放。

5、程序代码区:既可执行代码。

例:

#include <stdio.h>

int quanju;/*全局变量,全局区/静态区(static)*/

void fun(int f_jubu); /*程序代码区*/

int main(void)/**/

{

int m_jubu;/*栈区(stack)*/

static int m_jingtai;/*静态变量,全局区/静态区(static)*/

char *m_zifum,*m_zifuc = "hello";/*指针本身位于栈。指向字符串"hello",位于文字常量区*/

void (*pfun)(int); /*栈区(stack)*/

pfun=&fun;

m_zifum = (char *)malloc(sizeof(char)*10);/*指针内容指向分配空间,位于堆区(heap)*/

pfun(1);

printf("&quanju   : %x/n",&quanju);

printf("&m_jubu   : %x/n",&m_jubu);

printf("&m_jingtai: %x/n",&m_jingtai);

printf("m_zifuc   : %x/n",m_zifuc);

printf("&m_zifuc  : %x/n",&m_zifuc);

printf("m_zifum   : %x/n",m_zifum);

printf("&m_zifum  : %x/n",&m_zifum);

printf("pfun      : %x/n",pfun);

printf("&pfun     : %x/n",&pfun);

getch();

return 0;

}

void fun(int f_jubu)

{

static int f_jingtai;

printf("&f_jingtai: %x/n",&f_jingtai);

printf("&f_jubu   : %x/n",&f_jubu);/*栈区(stack),但是与主函数中m_jubu位于不同的栈*/

}

输出结果:

&f_jingtai: 404020

&f_jubu  
: 22ff40

&quanju  
: 404070

&m_jubu  
: 22ff74

&m_jingtai: 404010

m_zifuc  
: 403000

&m_zifuc 
: 22ff6c

m_zifum  
: 3d24e0

&m_zifum 
: 22ff70

pfun     
: 4013af

&pfun    
: 22ff68

分析:

堆区:

m_zifum   : 3d24e0

代码区:

pfun      : 4013af

局区/静态区(static):

m_zifuc   : 403000

&m_jingtai: 404010

&f_jingtai: 404020

&quanju   : 404070

栈区:

&f_jubu   : 22ff40 fun函数栈区

&pfun     : 22ff68 主函数栈区

&m_zifuc  : 22ff6c

&m_zifum  : 22ff70

&m_jubu   : 22ff74

二、堆和栈

1申请方式

stack:

由系统自动分配。
例如,声明在函数中一个局部变量 int b;
系统自动在栈中为b开辟空间

heap:

需要程序员手动申请,并指明大小,在c中,有malloc函数完成

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在栈中的。

2
申请后系统的响应

栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。

堆:大多数操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的free函数才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。

3申请大小的限制

栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

4申请效率的比较:

栈由系统自动分配,速度较快。但程序员是无法控制的。

堆是由程序员手动分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。

5堆和栈中的存储内容

栈:
在函数调用时,第一个进栈的是函数调用语句的下一条可执行语句的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。
当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是函数中的下一条指令,程序由该点继续运行。

堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的;

而bbbbbbbbbbb是在编译时就确定的;

但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。

比如:

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

对应的汇编代码

: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中,而第二种则要先把指针值读到edx中,在根据edx读取字符,显然慢了一些。

2
内存对齐问题

一、内存对齐的原因

大部分的参考资料都是如是说的:

1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

二、对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma
pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

规则:

1、数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma
pack指定的数值和这个数据成员

自身长度中,比较小的那个进行。

2、结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma
pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。

3、结合1、2可推断:当#pragma
pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。

三、试验

下面我们通过一系列例子的详细说明来证明这个规则

编译器:GCC 3.4.2、VC6.0

平台:Windows XP

典型的struct对齐

struct定义:

#pragma pack(n) /* n = 1, 2, 4, 8, 16 */

struct test_t {

int a;

char b;

short c;

char d;

};

#pragma pack(n)

首先确认在试验平台上的各个类型的size,经验证两个编译器的输出均为:

sizeof(char) = 1

sizeof(short) = 2

sizeof(int) = 4

试验过程如下:通过#pragma pack(n)改变“对齐系数”,然后察看sizeof(struct
test_t)的值。

1、1字节对齐(#pragma
pack(1))

输出结果:sizeof(struct test_t) = 8 [两个编译器输出一致]

分析过程:

1)
成员数据对齐

#pragma pack(1)

struct test_t {

int a; 
/* 长度4 > 1
按1对齐;起始offset=0 0%1=0;存放位置区间[0,3]
*/

char b; 
/* 长度1 = 1
按1对齐;起始offset=4 4%1=0;存放位置区间[4]
*/

short c; /*
长度2 > 1
按1对齐;起始offset=5 5%1=0;存放位置区间[5,6]
*/

char d; 
/* 长度1 = 1
按1对齐;起始offset=7 7%1=0;存放位置区间[7]
*/

};

#pragma pack()

成员总大小=8

2)
整体对齐

整体对齐系数 = min((max(int,short,char), 1) = 1

整体大小(size)=$(成员总大小)
按 $(整体对齐系数)
圆整 = 8 /* 8%1=0 */ [注1]

2、2字节对齐(#pragma
pack(2))

输出结果:sizeof(struct test_t) = 10 [两个编译器输出一致]

分析过程:

1)
成员数据对齐

#pragma pack(2)

struct test_t {

int a; 
/* 长度4 > 2
按2对齐;起始offset=0 0%2=0;存放位置区间[0,3]
*/

char b; 
/* 长度1 < 2
按1对齐;起始offset=4 4%1=0;存放位置区间[4]
*/

short c; /*
长度2 = 2
按2对齐;起始offset=6 6%2=0;存放位置区间[6,7]
*/

char d; 
/* 长度1 < 2
按1对齐;起始offset=8 8%1=0;存放位置区间[8]
*/

};

#pragma pack()

成员总大小=9

2)
整体对齐

整体对齐系数 = min((max(int,short,char), 2) = 2

整体大小(size)=$(成员总大小)
按 $(整体对齐系数)
圆整 = 10 /* 10%2=0 */

3、4字节对齐(#pragma
pack(4))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1)
成员数据对齐

#pragma pack(4)

struct test_t {

int a; 
/* 长度4 = 4
按4对齐;起始offset=0 0%4=0;存放位置区间[0,3]
*/

char b; 
/* 长度1 < 4
按1对齐;起始offset=4 4%1=0;存放位置区间[4]
*/

short c; /*
长度2 < 4
按2对齐;起始offset=6 6%2=0;存放位置区间[6,7]
*/

char d; 
/* 长度1 < 4
按1对齐;起始offset=8 8%1=0;存放位置区间[8]
*/

};

#pragma pack()

成员总大小=9

2)
整体对齐

整体对齐系数 = min((max(int,short,char), 4) = 4

整体大小(size)=$(成员总大小)
按 $(整体对齐系数)
圆整 = 12 /* 12%4=0 */

4、8字节对齐(#pragma
pack(8))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1)
成员数据对齐

#pragma pack(8)

struct test_t {

int a; 
/* 长度4 < 8
按4对齐;起始offset=0 0%4=0;存放位置区间[0,3]
*/

char b; 
/* 长度1 < 8
按1对齐;起始offset=4 4%1=0;存放位置区间[4]
*/

short c; /*
长度2 < 8
按2对齐;起始offset=6 6%2=0;存放位置区间[6,7]
*/

char d; 
/* 长度1 < 8
按1对齐;起始offset=8 8%1=0;存放位置区间[8]
*/

};

#pragma pack()

成员总大小=9

2)
整体对齐

整体对齐系数 = min((max(int,short,char), 8) = 4

整体大小(size)=$(成员总大小)
按 $(整体对齐系数)
圆整 = 12 /* 12%4=0 */

5、16字节对齐(#pragma
pack(16))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1)
成员数据对齐

#pragma pack(16)

struct test_t {

int a; 
/* 长度4 < 16
按4对齐;起始offset=0 0%4=0;存放位置区间[0,3]
*/

char b; 
/* 长度1 < 16
按1对齐;起始offset=4 4%1=0;存放位置区间[4]
*/

short c; /*
长度2 < 16
按2对齐;起始offset=6 6%2=0;存放位置区间[6,7]
*/

char d; 
/* 长度1 < 16
按1对齐;起始offset=8 8%1=0;存放位置区间[8]
*/

};

#pragma pack()

成员总大小=9

2)
整体对齐

整体对齐系数 = min((max(int,short,char), 16) = 4

整体大小(size)=$(成员总大小)
按 $(整体对齐系数)
圆整 = 12 /* 12%4=0 */

8字节和16字节对齐试验证明了“规则”的第3点:“当#pragma
pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果”。

4结束语

内存分配与内存对齐是个很复杂的东西,不但与具体实现密切相关,而且在不同的操作系统,编译器或硬件平台上规则也不尽相同,虽然目前大多数系统/语言都具有自动管理、分配并隐藏低层操作的功能,使得应用程序编写大为简单,程序员不在需要考虑详细的内存分配问题。但是,在系统或驱动级以至于高实时,高保密性的程序开发过程中,程序内存分配问题仍旧是保证整个程序稳定,安全,高效的基础。

[参考文献及技术支持]

[1] Brian.W.Kerighan <the C programming language> 2004.1

[2] W.richard stevens <unix环境高级编程>
2006.10

[3]csdn开发社区
c/c++版块
提供技术支持

[4]50M深蓝程序设计讨论组
提供技术支持

[注1]

什么是“圆整”?

举例说明:如上面的8字节对齐中的“整体对齐”,整体大小=9
按 4
圆整 = 12

圆整的过程:从9开始每次加一,看是否能被4整除,这里9,10,11均不能被4整除,到12时可以,则圆整结束。

原文链接:http://blog.csdn.net/cuibo1123/article/details/2547442

时间: 2024-12-28 15:39:03

c/c++深入篇之内存分配与内存对齐的探讨的相关文章

内存分配与内存管理的一些理解

内存分配方式与内存分配算法 内存分配方式有两种,连续内存分配方式和离散内存分配方式.不同的分配方式又有不同的分配算法. 内存分配算法,其实就是:有一大块空闲的资源,如何合理地分配资源?内存分配的思想可以用到很多其他的领域. ①连续内存分配方式 1)固定分区分配 将内存划分成若干个固定大小的块.将程序装入块中即可.内存划分成各个块之后,块大小不再改变.当然,划分块的方式有:所有的块大小相等:划分的块大小不相等. 这种方式,在实际的内存分配之前,就已经知道了所有的内存块大小了. 2)动态分区分配 需

Java内存分配和内存管理

首先是概念层面的几个问题: Java中运行时内存结构有哪几种? Java中为什么要设计堆栈分离? Java多线程中是如何实现数据共享的? Java反射的基础是什么? 然后是运用层面: 引用类型变量和对象的区别? 什么情况下用局部变量,什么情况下用成员变量? 数组如何初始化?声明一个数组的过程中,如何分配内存? 声明基本类型数组和声明引用类型的数组,初始化时,内存分配机制有什么区? 在什么情况下,我们的方法设计为静态化,为什么?(上次胡老师问文奇,问的哑口无言,当时想回答,却老感觉表述不清楚,这里

内存分配--静态内存、栈和堆

可编程内存在基本上分为这样的几大部分:静态存储区.堆区和栈区.他们的功能不同,对他们使用方式也就不同. 静态存储区:内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在.它主要存放静态数据.全局数据和常量. 栈区:在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放.栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限. 堆区:亦称动态内存分配.程序在运行的时候用malloc或new申请任意大小的内存,程序员自己负责在适当

垃圾收集器与内存分配策略-内存分配与回收策略

如何去给对象分配内存?大方向讲,就是在堆上分配(但也可能经过JIT编译后被拆散为标量类型并间接地在栈上分配) ①对象优先在Eden分配 大多数条件下,对象在Eden中分配,当Eden内存不够的时候,虚拟机将发起一次Minor GC. private static final int _1MB=1024*1024; /** * VM参数:-verbose:gc -Xms20M -Xmx20M -Xmn10M (限制了java堆大小为20MB,新生代10MB,老年代10MB)-XX:+PrintGC

动态内存分配连续内存空间的二维数组

可以直接使用一维数组来模拟二维数组,下面的代码就是在此基础上,用一个二级指针指向一维数组的相应地方,详见代码 #include <stdio.h> #include <malloc.h> int main() { int row,col,i,j,n=0; row=col=3; //malloc连续内存的二维数组 int **arr=(int**)malloc(row*sizeof(int*));//分配二维数组 arr[0]=(int*)malloc(row*col*sizeof(

[草稿][C语言][内存分配]常见内存错误

1. 使用未分配成功的内存 解决案: ①在使用内存前检查指针是否为NULL ②参数是指针时,在函数入口处用assert进行判断 ③如果指针指向动态申请的内存,用if进行容错处理 2. 使用分配成功,但未初始化的内存 解决案: ①定义数组后一定要初始化 3. 内存泄漏 解决案: ①new/malloc和delete/free一定要成对出现 4. 使用已被释放的内存 解决按: ①不要返回指向栈内存的指针或引用 ②释放内存后,将指针置为NULL

C语言结构体变量内存分配与地址对齐

地址对齐简单来说就是为了提高访问内存的速度. 数组的地址分配比较简单,由于数据类型相同,地址对齐是一件自然而然的事情. 结构体由于存在不同基本数据类型的组合,所以地址对齐存在不同情况,但总体来说有以下规则: 原则1:数据成员对齐规则:结构的数据成员,第一个数据成员放在偏移量(offset)为0的地方,以后每个数据成员存储的起始位置要从该成员大小的整数倍开始(比如int在32位机为4字节,则要从4的整数倍地址开始存储). 原则2:收尾工作:结构体的总大小,也就是sizeof的结果,必须是其内部最大

python源码分析----内存分配(1)

上面的一篇粗略的介绍了一下python的对象结构,这篇来分析一个非常重要的部分,内存分配... 好像自己看的源代码,只要是跟C语言相关的,都在内存处理方面做了相当多的工作....例如nginx,它也有实现自己的pool,python当然也不例外.... python在内存分配上面分成了4个层次吧... _____   ______   ______       ________ [ int ] [ dict ] [ list ] ... [ string ]       Python core

Netty源码—五、内存分配概述

Netty中的内存管理应该是借鉴了FreeBSD内存管理的思想--jemalloc.Netty内存分配过程中总体遵循以下规则: 优先从缓存中分配 如果缓存中没有的话,从内存池看看有没有剩余可用的 如果已申请的没有的话,再真正申请内存 分段管理,每个内存大小范围使用不同的分配策略 我们先总体上看下Netty内存分配的策略,然后再结合对应的数据结构来看看每种策略的具体实现. 总体分配策略 netty根据需要分配内存的大小使用不同的分配策略,主要分为以下几种情况(pageSize默认是8K, chun