基本定义:结构体,通俗讲就像是打包封装,把一些有共同特征(比如同属于某一类事物的属性,往往是某种业务相关属性的聚合)的变量封装在内部,通过一定方法访问修改内部变量。
结构体定义:
第一种:只有结构体定义
[cpp] view plain copy
- struct stuff{
- char job[20];
- int age;
- float height;
- };
第二种:附加该结构体类型的“结构体变量”的初始化的结构体定义
[cpp] view plain copy
- //直接带变量名Huqinwei
- struct stuff{
- char job[20];
- int age;
- float height;
- }Huqinwei;
也许初期看不习惯容易困惑,其实这就相当于:
[cpp] view plain copy
- struct stuff{
- char job[20];
- int age;
- float height;
- };
- struct stuff Huqinwei;
第三种:如果该结构体你只用一个变量Huqinwei,而不再需要用
[cpp] view plain copy
- struct stuff yourname;
去定义第二个变量。
那么,附加变量初始化的结构体定义还可进一步简化出第三种:
[cpp] view plain copy
- struct{
- char job[20];
- int age;
- float height;
- }Huqinwei;
把结构体名称去掉,这样更简洁,不过也不能定义其他同结构体变量了——至少我现在没掌握这种方法。
结构体变量及其内部成员变量的定义及访问:
绕口吧?要分清结构体变量和结构体内部成员变量的概念。
就像刚才的第二种提到的,结构体变量的声明可以用:
[cpp] view plain copy
- struct stuff yourname;
其成员变量的定义可以随声明进行:
[cpp] view plain copy
- struct stuff Huqinwei = {"manager",30,185};
也可以考虑结构体之间的赋值:
[cpp] view plain copy
- struct stuff faker = Huqinwei;
- //或 struct stuff faker2;
- // faker2 = faker;
- 打印,可见结构体的每一个成员变量一模一样
如果不使用上边两种方法,那么成员数组的操作会稍微麻烦(用for循环可能好点)
[cpp] view plain copy
- Huqinwei.job[0] = ‘M‘;
- Huqinwei.job[1] = ‘a‘;
- Huqinwei.age = 27;
- nbsp;Huqinwei.height = 185;
结构体成员变量的访问除了可以借助符号".",还可以用"->"访问(下边会提)。
引用(C++)、指针和数组:
首先是引用和指针:
[cpp] view plain copy
- int main()
- {
- struct stuff Huqinwei;
- struct stuff &ref = Huqinwei;
- ref.age = 100;
- printf("Huqinwei.age is %d\n",Huqinwei.age);
- printf("ref.age is %d\n",ref.age);
- struct stuff *ptr = &Huqinwei;
- ptr->age = 200;
- printf("Huqinwei.age is %d\n",Huqinwei.age);
- printf("ptr->age is %d\n",Huqinwei.age);
- //既然都写了,把指针引用也加上吧
- struct stuff *&refToPtr = ptr;
- refToPtr->age = 300;
- printf("Huqinwei.age is %d\n",Huqinwei.age);
- printf("refToPtr->age is %d\n",refToPtr->age);
- }
更正:之前给引用的初始化语句写错了,而且没注明引用是纯C中没有的东西(在这么个以C为幌子的博客中)。
引用是C++特有的一个机制,必须靠编译器支撑,至于引用转换到C中本质是什么,我有个帖子写过
结构体也不能免俗,必须有数组:
[cpp] view plain copy
- struct test{
- int a[3];
- int b;
- };
- //对于数组和变量同时存在的情况,有如下定义方法:
- struct test student[3] = {{{66,77,55},0},
- {{44,65,33},0},
- {{46,99,77},0}};
- //特别的,可以简化成:
- struct test student[3] = {{66,77,55,0},
- {44,65,33,0},
- {46,99,77,0}};
变长结构体
可以变长的数组
[cpp] view plain copy
- #include <stdio.h>
- #include <malloc.h>
- #include <string.h>
- typedef struct changeable{
- int iCnt;
- char pc[0];
- }schangeable;
- main(){
- printf("size of struct changeable : %d\n",sizeof(schangeable));
- schangeable *pchangeable = (schangeable *)malloc(sizeof(schangeable) + 10*sizeof(char));
- printf("size of pchangeable : %d\n",sizeof(pchangeable));
- schangeable *pchangeable2 = (schangeable *)malloc(sizeof(schangeable) + 20*sizeof(char));
- pchangeable2->iCnt = 20;
- printf("pchangeable2->iCnt : %d\n",pchangeable2->iCnt);
- strncpy(pchangeable2->pc,"hello world",11);
- printf("%s\n",pchangeable2->pc);
- printf("size of pchangeable2 : %d\n",sizeof(pchangeable2));
- }
运行结果
[cpp] view plain copy
- size of struct changeable : 4
- size of pchangeable : 4
- pchangeable2->iCnt : 20
- hello world
- size of pchangeable2 : 4
结构体本身长度就是一个int长度(这个int值通常只为了表示后边的数组长度),后边的数组长度不计算在内,但是该数组可以直接使用。
(说后边是个指针吧?指针也占长度!这个是不占的!原理很简单,这个东西完全是数组后边的尾巴,malloc开辟的是一片连续空间。其实这不应该算一个机制,感觉应该更像一个技巧吧)
20160405补充:
非弹性数组不能用"char a[]"这种形式定义弹性(flexible)变量,必须明确大小。
弹性数组在结构体中,下面的形式是唯一允许的:
[cpp] view plain copy
- struct s
- {
- int a;
- char b[] ;
- };
顺序颠倒会让b和a数据重合,会在编译时不通过。
char b[] = "hell";也不行(C和C++都不行)
少了整型变量a又会让整个结构体长度为0,compiler不允许编译通过!不同的是,其实C++形式上是允许空结构体的,本质上是通过机制避免了纯空结构体和类对象,自动给空结构体对象分配一个字节(sizeof()返回1)方便区分对象,避免地址重合!所以呢,C如果有空结构体,定义两个(或一打,或干脆一个数组)该结构体的变量(对象),地址是完全一样的!·!!!!!!!!调试看程序运行,这些语句其实都被当屁放了,根本没有运行,没有实际意义,C压根不支持空结构体这种东西(或者说我也没想好什么场合有用)
[cpp] view plain copy
- struct s2
- {
- // char a[] = "hasd" ;
- // int c;
- };
- int main()
- {
- struct s2 s22;
- struct s2 s23;
- struct s2 s24;
- struct s2 s25;
- }
例外的是,C++唯独不给带弹性数组的结构体分配空间(可能怕和变长结构体机制产生某种冲突,比如大小怎么算):
[cpp] view plain copy
- struct s
- {
- char b[] ;
- };
[cpp] view plain copy
- struct s
- {
- // char b[] ;
- };
C++中两者是不一样的,空的结构体反而“大”(sizeof()返回1)
20160321补充:这个机制利用了一个非常重要的特性——数组和指针的区别!数组和指针在很多操作上是一样的,但是本质不一样。最直观的,指针可以改指向,数组不可以,因为数组占用的每一个内
存地址都用来保存变量或者对象,而指针占用的内存地址保存的是一个地址,数组没有单独的保存指向地址的这样一个结构。数组的位置是固定的,正如指针变量自
身的位置也是固定的,改的是指针的值,是指向的目标地址,而因为数组不存储目标地址,所以改不了指向。企图把地址强制赋值给数组的话,也只是说把指针赋值
给数组,类型不兼容。
结构体嵌套:
结构体嵌套其实没有太意外的东西,只要遵循一定规律即可:
[cpp] view plain copy
- //对于“一锤子买卖”,只对最终的结构体变量感兴趣,其中A、B也可删,不过最好带着
- struct A{
- struct B{
- int c;
- }
- b;
- }
- a;
- //使用如下方式访问:
- a.b.c = 10;
特别的,可以一边定义结构体B,一边就使用上:
[cpp] view plain copy
- struct A{
- struct B{
- int c;
- }b;
- struct B sb;
- }a;
使用方法与测试:
[cpp] view plain copy
- a.b.c = 11;
- printf("%d\n",a.b.c);
- a.sb.c = 22;
- printf("%d\n",a.sb.c);
- 结果无误。
但是如果嵌套的结构体B是在A内部才声明的,并且没定义一个对应的对象实体b,这个结构体B的大小还是不算进结构体A中。
结构体与函数:
关于传参,首先:
[cpp] view plain copy
- void func(int);
- func(a.b.c);
把结构体中的int成员变量当做和普通int变量一样的东西来使用,是不用脑子就想到的一种方法。
另外两种就是传递副本和指针了 :
[cpp] view plain copy
- //struct A定义同上
- //设立了两个函数,分别传递struct A结构体和其指针。
- void func1(struct A a){
- printf("%d\n",a.b.c);
- }
- void func2(struct A* a){
- printf("%d\n",a->b.c);
- }
- main(){
- a.b.c = 112;
- struct A * pa;
- pa = &a;
- func1(a);
- func2(&a);
- func2(pa);
- }
占用内存空间:
struct结构体,在结构体定义的时候不能申请内存空间,不过如果是结构体变量,声明的时候就可以分配——两者关系就像C++的类与对象,对象才分配内存(不过严格讲,作为代码段,结构体定义部分“.text”真的就不占空间了么?当然,这是另外一个范畴的话题)。
结构体的大小通常(只是通常)是结构体所含变量大小的总和,下面打印输出上述结构体的size:
[cpp] view plain copy
- printf("size of struct man:%d\n",sizeof(struct man));
- printf("size:%d\n",sizeof(Huqinwei));
- 结果毫无悬念,都是28:分别是char数组20,int变量4,浮点变量4.
下边说说不通常:
对于结构体中比较小的成员,可能会被强行对齐,造成空间的空置,这和读取内存的机制有关,为了效率。通常32位机按4字节对齐,小于的都当4字节,
有连续小于4字节的,可以不着急对齐,等到凑够了整,加上下一个元素超出一个对齐位置,才开始调整,比如3+2或者1+4,后者都需要另起(下边的结构体
大小是8bytes),相关例子就多了,不赘述。
[cpp] view plain copy
- struct s
- {
- char a;
- short b;
- int c;
- }
相应的,64位机按8字节对齐。不过对齐不是绝对的,用#pragma pack()可以修改对齐,如果改成1,结构体大小就是实实在在的成员变量大小的总和了。
和C++的类不一样,结构体不可以给结构体内部变量初始化,。
如下,为错误示范:
[cpp] view plain copy
- #include<stdio.h>
- //直接带变量名Huqinwei
- struct stuff{
- // char job[20] = "Programmer";
- // char job[];
- // int age = 27;
- // float height = 185;
- }Huqinwei;
PS:结构体的声明也要注意位置的,作用域不一样。
C++的结构体变量的声明定义和C有略微不同,说白了就是更“面向对象”风格化,要求更低。
那么熟悉了常用方法,都要注意哪些常犯错误呢,见C语言结构体常见错误。