二进制文件和ASCII文件有何区别

二进制文件和ASCII文件（即文本文件）的区别，对于和计算机亲近时间尚短的同学是个难题。

1、一个例子：两种100000

　　有程序：

#include<iostream>
using namespace std;
int main( )
{
char c[8]="100000";
int n=100000;
cout<<"c="<<c<<endl;
cout<<"n="<<n<<endl;
return 0;
}

　　运行结果：
　　c=100000
　　n=100000

　　c和n的输出看起来是一样的，那两者真的一样吗？

　　显然不是一回事。
　　有图为证。下面是在CodeBlock中单步执行上面的程序时，跟踪c和n的值看到的情形。
　　
　　（注：要将待观察的数据以二进制形式显示出来，方法见本文附注部分。）
　　
　　字符串的c占用了8个字节，保存的是：1个‘1‘（ASCII码为49，二进制110001）、5个‘0‘（ASCII码为48，二进制110000），最后2个字节为‘\0‘（ASCII码为0）
　　而整型的n，用4个字节（可以将图中二进制1 1000 0110 1010 0000转成十进制，正好100000。本来4字节32位，前面的0省略了。）
　　重点品味一下n。n在内存中用4字节表示，那样一种形式，对掌握计算机内部机制的人不是回事，但对和计算机尚做不到十分亲近的人而言，32位的数据就是#@!#[email protected]#...。当程序中用cout<<n的方式显示n值时，给出的是100000。可敬的cout！
　　实际上，cout输出过程中，计算机已经给我们做了转换：将n的二进制内部表示，转换成了人乐于看到的字符形式。
　　

2、将n保存到ASCII文件什么样

[cpp] view plain copy

print ?

#include<fstream>
using namespace std;
int main( )
{
int n=100000;
ofstream out("a.dat",ios::out);
out<<n<<endl;
return 0;
}

　　运行这一段程序，是将n输出到ASCII文件a.dat中。
　　文件可以用记事本打开，如图：
　　
　　显然，ASCII文件中表示n时，也是“看起来”的样子，而不是n在内存里的实际表示形式
　　

3、将n保存到二进制文件什么样

[cpp] view plain copy

print ?

#include<fstream>
using namespace std;
int main( )
{
int n=100000;
ofstream out("b.dat",ios::out|ios::binary);
out.write((char*)&n, sizeof(n));
return 0;
}

　　运行这一段程序，是用对二进制文件写入的方式，将n输出到文件b.dat中。
　　用记事本打开b.dat文件，如图：
　　
　　纳尼？这是个神马字？你会念吗？开什么玩笑！
　　找一个查看二进制文件的软件（我用BinaryViewer），看到的b.txt如下：
　　
　　文件为4字节大。按高位优先的原则（将图中显示的4个字节由后往前取出来），里面保存的数的十六进制形式是：0x000186A0，展开成二进制形式，自然是1 1000 0110 1010 0000，这恰是十进制数100000在内存中的形式。至于为何显示的是那么一个怪字，需要了解汉字编码的知识，参见《用C++程序理解汉字的机内码表示》（跳转之前，先将本文读完）。
　　
　　用BinaryViewer也看一下a.txt——前文中另一个也是保存100000的文件，只不过，是ASCII文件。查看结果是：
　　
　　文件共有8字节，前面的6个字节，保存的是：1个‘1‘（ASCII码为49，十六进制31）、5个‘0‘（ASCII码为48，十六进制30）。
　　
　　由此可以看出二进制文件和ASCII文件的区别：前者，用和内存中一样的方式保存数据；而后者，用和cout显示一样的方式保存，存的是人“看起来”的那个样子。
　　不方便人看的二进制文件实际上效率更高，用途更广，初学编程的童鞋，不要错过学会它的机会。