解析“extern”
1、 声明外部变量
现代编译器一般採用按文件编译的方式,因此在编译时,各个文件里定义的全局变量是
互相透明的,也就是说,在编译时,全局变量的可见域限制在文件内部。以下举一个简单的样例。创建一个project,里面含有A.cpp和B.cpp两个简单的C++源文件:
//A.cpp int i; void main() { } |
//B.cpp int i; |
这两个文件极为简单,在A.cpp中我们定义了一个全局变量i,在B中我们也定义了一个全局变量i。
我们对A和B分别编译,都能够正常通过编译,可是进行链接的时候,却出现了错误,错误提演示样例如以下:
Linking... B.obj : error LNK2005: "int i" ([email protected]@3HA) already defined in A.obj Debug/A.exe : fatal error LNK1169: one or more multiply defined symbols found Error executing link.exe. A.exe - 2 error(s), 0 warning(s) |
这就是说,在编译阶段,各个文件里定义的全局变量相互是透明的,编译A时觉察不到B中也定义了i,同样,编译B时觉察不到A中也定义了i。
可是到了链接阶段,要将各个文件的内容“合为一体”,因此,假设某些文件里定义的全局变量名同样的话,在这个时候就会出现错误,也就是上面提示的反复定义的错误。
因此,各个文件里定义的全局变量名不可同样。
在链接阶段,各个文件的内容(实际是编译产生的obj文件)是被合并到一起的,因而,定义于某文件内的全局变量,在链接完毕后,它的可见范围被扩大到了整个程序。
这样一来,按道理说,一个文件里定义的全局变量,能够在整个程序的不论什么地方被使用,举例说,假设A文件里定义了某全局变量,那么B文件里应能够该变量。改动我们的程序,加以验证:
//A.cpp void main() { i = 100; //试图使用B中定义的全局变量 } |
//B.cpp int i; |
编译结果例如以下:
Compiling... A.cpp C:/Documents and Settings/wangjian/桌面/try extern/A.cpp(5) : error C2065: ‘i‘ : undeclared identifier Error executing cl.exe. A.obj - 1 error(s), 0 warning(s) |
编译错误。
事实上出现这个错误是意料之中的,由于:文件里定义的全局变量的可见性扩展到整个程序是在链接完毕之后,而在编译阶段,他们的可见性仍局限于各自的文件。
编译器的目光不够长远,编译器没有能够意识到,某个变量符号尽管不是本文件定义的,可是它可能是在其他的文件里定义的。
尽管编译器不够远见,可是我们能够给它提示,帮助它来解决上面出现的问题。这就是extern的作用了。
extern的原理非常easy,就是告诉编译器:“你如今编译的文件里,有一个标识符尽管没有在本文件里定义,可是它是在别的文件里定义的全局变量,你要放行!”
我们为上面的错误程序加上externkeyword:
//A.cpp extern int i; void main() { i = 100; //试图使用B中定义的全局变量 } |
//B.cpp int i; |
顺利通过编译,链接。
2、 在C++文件里调用C方式编译的函数
C方式编译和C++方式编译
相对于C,C++中新增了诸如重载等新特性,对于他们的编译,必定有一些重要的差别。
我们将以下的小程序分别按C和C++方式编译,来探讨两种编译方式的差别。
int i; int func(int t) { return 0; } void main() { } |
以C方式编译的结果:
COMM _i : DWORD PUBLIC _func PUBLIC _main |
以C++方式编译的结果:
PUBLIC [email protected]@3HA ; i PUBLIC [email protected]@[email protected] ; func PUBLIC _main |
可见,C方式编译下,变量名和函数名之前被统一加上了一个下划线,而C++编译后的结果却复杂的多,i变成了[email protected]@3HA,func变成了[email protected]@[email protected]。C++中的这种看似复杂的命名规则是为C++中的函数重载,參数检查等特性服务的。
多文件程序中的函数调用
普通情况下,project中的文件都是CPP文件(以及头文件)。如以下的程序仅包括两个文件:A.CPP和B.CPP:
//A.CPP void func(); void main() { func(); } |
//B.CPP void func() { } |
程序的结构是这种:在文件B.CPP中定义了一个函数void func(),main函数位于文件A.CPP,在main函数中调用了B中定义的函数func()。
要在A中调用B中定义的函数,必须要加上该函数的声明。如本例中的void func();就是对函数func()的声明。
假设没有声明的话,编译A.CPP时就会出错。由于编译器的目光仅仅局限于被编译文件,必须通过增加函数声明来告诉编译器:“某个函数是定义在其他的文件里的,你要放行!”,这一点跟用extern来声明外部全局变量是一个道理。
须要注意的是,一般的程序都是通过包括头文件来完毕函数的声明。拿本例来说,通常是创建一个头文件B.H,在头文件里增加声明语句void func(); 而且在A.CPP中增加包括语句:#include “B.H”。
在C++程序中,头文件的功能从函数声明被扩展为类的定义。
不同编译方式下的函数调用
假设在project中,不仅有CPP文件,还有以C方式编译的C文件,函数调用就会有一些微妙之处。我们将B.CPP改作B.C:
//A.CPP void func(); void main() { func(); } |
//B.C void func() { } |
对A.CPP和B.C分别编译,都没有问题,可是链接时出现错误。
Linking... A.obj : error LNK2001: unresolved external symbol "void __cdecl func(void)" ([email protected]@YAXXZ) Debug/A.exe : fatal error LNK1120: 1 unresolved externals Error executing link.exe. A.exe - 2 error(s), 0 warning(s) |
原因就在于不同的编译方式产生的冲突。
对于文件A,是依照C++的方式进行编译的,当中的func()调用被编译成了
call [email protected]@YAXXZ |
假设B文件也是依照C++方式编译的,那么B中的func函数名也会被编译器改成[email protected]@YAXXZ,这种话,就没有不论什么问题。
可是如今对B文件,是依照C方式编译的,B中的func函数名被改成了_func,这样一来,A中的call [email protected]@YAXXZ这个函数调用就没有了着落,由于在链接器看来,B文件里没有名为[email protected]@YAXXZ的函数。
事实是,我们编程者知道,B文件里有A中调用的func函数的定义,仅仅只是它是依照C方式编译的,故它的名字被改成了_func。因而,我们须要通过某种方式告诉编译器:“B中定义的函数func()经编译后命名成了_func,而不是[email protected]@YAXXZ,你必须通过call _func来调用它,而不是call [email protected]@YAXXZ。”简单的说,就是告诉编译器,调用的func()函数是以C方式编译的,fun();语句必须被编译成call _func;而不是call [email protected]@YAXXZ。
我们能够通过externkeyword,来帮助编译器解决上面提到的问题。
对于本例,仅仅需将A.CPP改成例如以下就可以:
//A.CPP extern "C" { void func(); } void main() { func(); } |
察看汇编代码,发现此时的func();语句被编译成了call _func。
3、 补充
同2一样,仍然是C,C++混合编程的情形,考虑以下的程序:
//A.CPP extern int i; void main() { i = 100; } |
//B.C int i; |
程序非常easy:在文件B.C中定义了一个全局变量i,在A.CPP中使用了这个全局变量。
编译没有问题,链接时却出现错误:
Linking... A.obj : error LNK2001: unresolved external symbol "int i" ([email protected]@3HA) Debug/A.exe : fatal error LNK1120: 1 unresolved externals Error executing link.exe. A.exe - 2 error(s), 0 warning(s) |
这是由于,在C方式编译下,i被重命名为_i,而在C++方式下,i会被重命名为[email protected]@3HA。
因而,我们仅仅用extern int i;来声明还不够,必须告诉编译器,全局变量i是以C方式编译的,
它会被重命名为_i,而不是[email protected]@3HA。
我们改动A.CPP,例如以下:
//A.CPP extern "C" { int i; } void main() { i = 100; } |
程序正常通过编译和链接。
我们察看一下汇编代码,发现语句i = 100;被编译成了mov DWORD PTR _i, 100。