1. 结构的基础知识
跟数组一样是成员的集合,但与数组有很大的区别,结构的元素不能通过下标法来访问,因为各个成员的大小可能不同,但是数组可以,因为数组元素保持一致。
1.1 结构声明
struct tag {member-list }
variable-list ;
上面黑色部分是可选部分,但是必须同时出现两个。
实例一:下面是实例:
struct{ int a ; char b ; float c ; }x,y[20],*z;
上面定义了实例化了x,y[20],*z ;
x是结构变量,y是结构的数组包含了20个structures,z是指向结构的指针。
实例二:当然还有一种方法声明这些变量:
struct SIMPLE{ int a ; char b ; float c ; }; struct SIMPLE x ; struct SIMPLE y[20],*z ;
实例三:我们还可以利用typedef来声明:
typedef struct { int a ; char b ; float c ; }Simple; Simple x ; Simple y[20],*z ;
此处的Simple并不再像实例1中的实例化的结构了,也不是实例2中的tag,他是一个类型名称。
1.2 结构成员
我们前面举的例子只用到了简单的类型,其实外部成员可以定义的结构内的成员都可以定义,如下:
struct COMPLEX{ float f ; int a[20] ; long *lp ; struct SIMPLE s ; struct SIMPLE sa[10] ; struct SIMPLE *sp ; };
1.3 自引用结构
首先看下面的代码哪里有错误:
struct SELF_REF1{ int a ; struct SELF_REF1 b ; int c ; };
你会发现上面代码实际上类似于没有终止条件的递归。下面我们来改进它,改为指向结构的指针,多应用与链表和树的实现:
struct SELF_REF1{ int a ; struct SELF_REF1 *b ; int c ; };
看看下面错误的代码:
typedef struct { int a ; SELF_REF3 *b ; int c ; }SELF_REF3 ;
你会发现上面结构中的SELF_REF3的定义在代码的最后面,所以结构内的未定义。修改后如下:
typedef struct SELF_REF3_TAG{ int a ; struct SELF_REF3_TAG *b ; int c ; }SELF_REF3 ;
1.4 不完全声明
不多说直接代码
struct B ; struct A{ struct B *partner ; }; struct B{ struct A *partner ; }
上面的struct B;就是不完全声明。对于相互依赖的结构,ni
1.5 结构的初始化
struct INIT_EX{ int a ; short b[10] ; Simple c ; }x = { 10, {1,2,3,4,5}, {25,‘x‘,1.9} };
2. 结构,指针,成员
typedef struct{ int a ; short b[2] ; }Ex2; typedef struct EX{ int a ; char b[3] ; Ex2 c ; struct EX *d ; }Ex;
上面的结构EX的内存存储如下:
Ex x = {10,‘Hi‘,{5,{-1,25}},0} ; Ex *px = &x ;
上面代码的内存分配如下:
假如我们要得到一个指向结构中a和b中第二个元素的指针,则:
int *p1 = &px->a ; //->优先于&
int *p2 = &px->b[1] ;
大家看下这段代码表示什么:
*px->c.b ;
首先px->c表示结构c,px->c.b表示数组b的第一个元素的常量指针,*(px->c.b)表示数组b的第一个元素的值,即-1;
3. 结构存储分配
编译器按照成员类别的顺序一个一个的给每个成员分配内存。只有当存储成员时需要满足正确的边界对齐要求时,成员之间才可能出现用于填充的额外内存空间。(硬件注意事项---边界对齐;在要求边界对齐的机器上,整形值的起始位置只能是某些特定字节,通常是2或者4的倍数);
关于边界对齐:(来自百度百科)
各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问 一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对 数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。[显然这是在时间和空间之间做出的一种取舍](字节对齐的实现和具体的编译器有关)
点击(此处)折叠或打开
- struct S{
- char a;
- int b;
- char c;
- };
如果某个机器的整型值长度是4个字节,并且它的起始存储位置必须能够被四整除,那么这一结构在内存中的存储为:
白色方块表示结构成员的存储位置。
系统禁止编译器在一个结构的起始位置跳过几个字节来满足边界对齐的要求,因此所有结构的起始存储位置必须是结构中边界要求最严格的数据类型所要求的位置。因此,a成员必须存储于一个能别4整除的地址。结构的下一个成员时一个整型值,所有它必须跳过3个字节(灰色表示)到适合的边界才能存储。在整形之后是最后一个字符。
如果声明了相同类型的第2个变量,它的起始存储位置也必须满足4这个边界,所有第一个结构的后面还要再跳过3个字节才能存储第二个结构。因此,每个结构将占据12个字节的存储空间但实际只是用其中的6个,这个利用率不是很出色。按照这种存储方法,结构的大小不是所有成员大小之后,而是成员数*最大成员所占内存大小。
当然可以再声明中对结构的结构成员类别进行重新排列,让那些对边界要求最严格的成员首先出现,对边界要求最弱的成员最后出现。这种做法可以最大限度的减少因边界对齐所带来的空间损失。
例如将上面的例子改写为:
点击(此处)折叠或打开
- struct S{
- int b;
- char a;
- char c;
- };
将边界要求为4的整型b最先出现,同样的结构体它只占用了8个字节,节省了33%的空间。两个字符可以紧凑这存储,所有只有结构最后面需要跳过两个字节才被浪费。
c语言提供了一种机制来解决这种在struct里填充字节来满足对齐要求。这种机制就是__packed(packed前面是两个下划线)。
__attribute__:是GNU C的一大特色机制。
__attribute__可以设置函数属性(Function Attribute)、变量属性(Variable Attribute)和类型属性(Type Attribute)
__attribute__前后都有两个下划线,并且后面会紧跟一对原括弧,括弧里面是相应的__attribute__参数
__attribute__语法格式为:
__attribute__ ( ( attribute-list ) )
函数属性(Function Attribute),函数属性可以帮助开发者把一些特性添加到函数声明中,从而可以使编译器在错误检查方面的功能更强大。
__attribute__机制也很容易同非GNU应用程序做到兼容。
关键字__attribute__可以对结构体(struct)或共用体(union)进行属性设置。
有六个参数可供选择:aligned,packed,transparent_union,unused,deprecated,may_alias
这里我们讨论packed,使用该属性可以使得变量或者结构体成员使用最小的对齐方式,即对变量是一字节对齐,对域(field)是位对齐。
更多关于__attribute__的使用方法说明:
http://blog.csdn.net/sunboy_2050/article/details/6566739
利用sizeof来分析:
sizeof使用介绍
本文主要包括二个部分,第一部分重点介绍在VC中,怎么样采用sizeof来求结构的大小,以及容易出现的问题,并给出解决问题的方法,第二部分总结出VC中sizeof的主要用法。
1、sizeof应用在结构上的情况
请看下面的结构:
struct MyStruct
{
double d1;
char d2;
int in
};
对结构MyStruct采用sizeof会出现什么结果呢?
sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是当在VC中测试上面结构的大小时,会发现sizeof(MyStruct)为16。
类型 对齐方式(变量存放的起始地址相对于结构的起始地址的偏移量)
char 偏移量必须为sizeof(char)即1的倍数
int 偏移量必须为sizeof(int)即4的倍数
float 偏移量必须为sizeof(float)即4的倍数
double 偏移量必须为sizeof(double)即8的倍数
Short 偏移量必须为sizeof(short)即2的倍数
各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对齐方式调整位置,空缺的字节VC会自动填充。同时VC为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节。
下面用前面的例子来说明VC到底怎么样来存放结构的。
struct MyStruct
{
double d1;
char d2;
int in;
};
为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式,先为第一个成员d1分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为 sizeof(double)的倍数),该成员变量占用sizeof(double)=8个字节;接下来为第二个成员d1分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数,所以把d1存放在偏移量为8的地方满足对齐方式,该成员变量占用sizeof (char)=1个字节;接下来为第三个成员in分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为9,不是sizeof(int)=4的倍数,为了满足对齐方式对偏移量的约束问题,VC自动填充3个字节(这三个字节没有放什么东西),这时下一个可以分配的地址对于结构的起始地址的偏移量为
12,刚好是sizeof(int)=4的倍数,所以把type存放在偏移量为12的地方,该成员变量占用sizeof(int)=4个字节;这时整个结构的成员变量已经都分配了空间,总的占用的空间大小为:8+1+3+4=16,刚好为结构的字节边界数(即结构中占用最大空间的类型所占用的字节数 sizeof(double)=8)的倍数,所以没有空缺的字节需要填充。所以整个结构的大小为:sizeof(MyStruct)=8+1+3+4= 16,其中有3个字节是VC自动填充的,没有放任何有意义的东西。
sizeof(MyStruct)为多少呢?也许你会这样求:
其实,这是VC对变量存储的一个特殊处理。为了提高CPU的存储速度,VC对一些变量的起始地址做了“对齐”处理。在默认情况下,VC规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量的类型所占用的字节数的倍数。下面列出常用类型的对齐方式(vc6.0,32位系统)。
下面再举个例子,交换一下上面的MyStruct的成员变量的位置,使它变成下面的情况:
struct MyStruct {char dda; double dda1; int type; };
这个结构占用的空间为多大呢?在VC6.0环境下,可以得到sizeof(MyStruc)为24。结合上面提到的分配空间的一些原则,分析下VC怎么样为上面的结构分配空间的。(简单说明)
struct MyStruct { char dda; double dda1; int type; };
所有成员变量都分配了空间,空间总的大小为1+7+8+4=20,不是结构的节边界数(即结构中占用最大空间的基本数据类型所占用的字节数sizeof(double)=8)的倍数,所以需要填充4个字节,以满足结构的大小为sizeof(double)=8的倍数。
所以该结构总的大小为:sizeof(MyStruc)为1+7+8+4+4=24。其中总的有7+4=11个字节是VC自动填充的,没有放任何有意义的东西。
typedef struct {double i; int k[5]; char d[5]; char c;} DATE;
struct data { short cat; DATE cow; int dog;};
DATE max;
int a = sizeof(max);// 40
int nDataSize = sizeof(data);// 56
VC对结构的存储的特殊处理确实提高CPU存储变量的速度,但是有时候也带来了一些麻烦,我们也屏蔽掉变量默认的对齐方式,自己可以设定变量的对齐方式。
VC中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:
第一、如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式(不用满足n对齐方式) ; 第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数(不用满足默认的对齐方式)。
结构的总大小也有个约束条件,分下面两种情况:如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数; 否则必须为n的倍数。
#pragma pack(n)
它指定了结构成员按n(1,2,4,8,16)字节对齐,如果未指定n即#pragma pack(),则恢复成默认值。
当n大于结构体或类等的最大字节那个变量的字节时,n就等于最大字节的那个变量的字节,结构体或类的总字节数必须为n的整数倍(就如没用#pragma pack (n)时结构体或类的总字节数必须为最大字节变量的字节的整数被)
下面举例说明其用法。
#pragma pack(push) //保存对齐状态
#pragma pack(4)//设定为4字节对齐
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack(pop)//恢复对齐状态
以上结构的大小为16,下面分析其存储情况,首先为m1分配空间,其偏移量为0,满足我们自己设定的对齐方式(4字节对齐),m1占用1个字节。接着开始为m4分配空间,这时其偏移量为1,需要补足3个字节,这样使偏移量满足为n=4的倍数(因为sizeof(double)大于n),m4占用8个字节。接着为m3分配空间,这时其偏移量为12,满足为4的倍数,m3占用4个字节。这时已经为所有成员变量分配了空间,共分配了16个字节,满足为n的倍数。如果把上面的#pragma pack(4)改为#pragma pack(16),那么我们可以得到结构的大小为24。
2、 sizeof用法总结
在VC中,sizeof有着许多的用法,而且很容易引起一些错误。下面根据sizeof后面的参数对sizeof的用法做个总结。
A. 参数为数据类型或者为一般变量。例如sizeof(int),sizeof(long)等等。这种情况要注意的是不同系统系统或者不同编译器得到的结果可能是不同的。例如int类型在16位系统中占2个字节,在32位系统中占4个字节。
B. 参数为数组或指针。下面举例说明.
int a[50]; //sizeof(a)=4*50=200; 求数组所占的空间大小
int *a=new int[50];// sizeof(a)=4; a为一个指针,sizeof(a)是求指针
//的大小,在32位系统中,当然是占4个字节。
C. 参数为结构或类。Sizeof应用在类和结构的处理情况是相同的。但有两点需要注意,第一、结构或者类中的静态成员不对结构或者类的大小产生影响,因为静态变量的存储位置与结构或者类的实例地址无关。
第二、没有成员变量的结构或类的大小为1,因为必须保证结构或类的每一个实例在内存中都有唯一的地址。
下面举例说明,
Class Test{int a;static double c};//sizeof(Test)=4.
Test *s;//sizeof(s)=4,s为一个指针。
Class test1{ };//sizeof(test1)=1;
D. 参数为其他。下面举例说明。
int func(char s[5]);
{
//sizeof(s)这里将输出4,本来s为一个数组,
//但由于做为函数的参数在传递的时候系统处理为一个指针,所以sizeof(s)实际上为求指针的大小。
return 1;
}
sizeof(func(“1234”))=4//因为func的返回类型为int,所以相当于
//求sizeof(int).
1 2 3 4 5 6 7 8 9 10 11 |
|
int 4字节
char 1字节
struct s1 不是5字节,而是8字节
因为编译器为了执行的效率,所以struct的存储分配进行了字节对齐,它的大小要取决于其中最宽类型的大小。此时char之后会被添加填充字节,满足int的宽度。
4.结构作为函数的参数
typedef struct { int a ; char b ; float c ; }Simple;
当该结构
fun(Simple mystruct) ;
因为c是按值传递,所以传递给函数的是一个结构的复制,此时传递的大小就是结构的大小,如果我们利用指针就不同了。
fun(Simple *mystruct) ;
此时传递的是指针,只有4个字节。所以效率更高了。
调用该函数是用fun(&mystruct) ;
如果你想修改结构的成员可以定义为const指针。