本文转载地址:http://www.cnblogs.com/dolphin0520/archive/2011/11/09/2242138.html
在原文的基础上加入自己的想法作为修改。
指针是C/C++的精华,而指针和数组又是一对欢喜冤家,很多时候我们并不能很好的区分指针和数组,对于刚毕业的计算机系的本科生很少有人能够熟练掌握指针以及数组的用法和区别。造成这种原因可能跟现在大学教学以及现在市面上流行的很多C或者C++教程有关,这些教程虽然通俗易懂,但是在很多关键性的地方却避而不谈或者根本阐述不清楚,甚至很多时候阐述的是错误的观点。一般最初学习C/C++的时候接触到的都是这类教程,学习效果可想而知。对于初学者选择好的教程真的很关键,因为先入为主,一旦你接受了错误的观点或者思想即使后来知道了也一时很难纠正过来(我是深有体会),在此我推荐三本很适合于初学者的教程:
《The C Programming Language》Brian W. Kernighan和Dennis M. Ritchie的经典著作(K&R圣经)
《C ++ Primer》Stanley B. Lippman, Josée Lajoie, Barbara E. Moo C++经典权威著作
《Pointers on C》Kenneth A.Reek
很多时候,会有人说“指针和数组是相同的”,这是一种非常危险的说法,并不完全正确。在一定的上下文环境中,指针和数组是等同的,并非所有情况下如此。然而人们很多时候却自然而然忽略了这种情况成立的条件,去假定所有情况下都是如此。下面着重谈一下指针和数组的区别。
一.指针和数组的定义
指针是指针,指针变量存储的是一个地址,用来间接访问数据,在32位系统下,一个指针变量(包括void指针)一般占4个字节的空间(有的编译器是占2个字节)。指针可以指向任何内存空间,但不是任何内存空间都可以通过指针去访问。
数组是数组,定义一个数组之后,编译器便根据该数组元素的类型和个数在内存开辟一段连续的空间来存放数据,从而直接访问数据。
下面看一个例子
在file1.c中有如下代码:
char p[100]="abcdef";
在file2.c中有如下代码:
#include<stdio.h> extern char *p; int main(void) { printf("%c\n",p[1]); return 0; }
发现能够编译通过,但是能正确执行么?调试发现:出现下图这个错误,无法计算得到p[1]的值。原因稍后作解释。
从这里就可以看出,指针和数组并不是等同的,数组的定义并不等同于指针的外部声明(注意声明和定义的区别,定义是为一个变量或者对象分配内存空间,而声明只是描述类型)。
二.指针和数组访问时的区别
对数组下标的引用:
提示:
编译器的符号表中记录的是这样的一些字段: 变量标识符 对应的内存的地址 变量的类型 在程序中每次使用这个标识符时,都会首先查找到这个标识符对应的内存单元的地址,然后从相应大小的内存单元中取数据。
对指针的引用:
提示:
因为p是一个指针变量,所以要首先找到这个变量对应的内存的单元中放的是什么数据,这一个步骤和其他的ing类型的变量的取值是一样的。 然后把取出来的值再当做一个地址去取内存单元中的值。
从上面的图中可以看出,指针和数组根本就是两个完全不一样的东西。对于数组,由于编译器在编译的时候就已经知道每个符号的地址(这个地址是临时的,在载入程序的时候要根据在内存的载入的位置进行重定位,但是这个位置要在编译的时候确定,这样才能把这个值同重定位寄存器里的值相加完成重定位的过程),因此如果需要一个地址来执行某种操作,可以直接进行操作,并不需要增加指令首先取得具体地址,对于数组就是如此;而对于指针,必须在运行时首先取得它当前的具体值然后才能进行引用。从这点就可以解释为什么上面的程序无法正确执行,因为在file1.c中定义的p是一个数组,而在file2.c中却声明的是一个指针。因此在file2.c中引用时默认p是一个指针变量,并且会把指针变量中的任何数据当做地址来处理,因此首先取原数组的前4个字节的内容:0x61 0x62 0x63 0x64构成一个地址(暂不考虑大小端的问题)0x61626364,然后按照char型读取0x61626364这个地址中的内容,但是这个地址可能并不是有效地地址,即使是有效地,也不是我们想要的。大家可以想一下如果在file1.c中将p定义为指针类型,而在file2.c中将p声明为数组类型,会是什么情况?
测试程序:
file2.c
#include<stdio.h> #include <stdlib.h> extern char p[]; extern void print(); int main(void) { print(); printf("%x\n",p[0]); printf("%x\n",p[1]); printf("%08x\n",p); //注意此时p的值是存储原指针p(file1.c中的p)的内存单元的首地址 system("pause"); return 0; }
file1.c
#include<stdio.h> char *p="abcdef"; void print() { printf("%08x\n",p); printf("%08x\n",&p); }
执行结果为:
解决上述问题的办法就是在任何时候保持定义和声明一致。
三.一些应该注意的地方
1.sizeof计算所占空间时的区别。
对于数组,sizeof计算的是整个数组所占的空间,而在32位系统下,sizeof 指针的值始终为4.
2.数组名作为左值时不能被修改,而指针作为左值时可以被赋值。
3.指针可以进行自增(自减)运算(void指针除外,因为void指针无法知道步长),但是数组不能进行自增或者自减运算。
4.理解char *p="abcde"和char str[]="abcde"的区别。
具体来说,对于编译器的符号表来说:
根据表中p对应的内存地址,从内存的存储单元中找到的是存储字符串的地址;
根据表中str对应的内存地址,从内存的存储单元中找到的是存储的字符串。