平时我在写html文件时,很容易忘掉这个文件的编码类型,<meta charset=”utf-8”>
的语句,因为编辑器默认设置了一个编码,所以在我没有写编码格式设置语句的情况下,效果依然可以出来。可是今天,我在用Sublime Text的编辑器,新建一个html文件时,就出现了问题,用浏览器打开后发现是乱码。后来我补上了<meta charset=”utf-8”>,显示就正常了。看来细节是不容忽视的,特别是做开发的,也许一些小标点或一个字符,也能造成很大的错误。那么对于html的编码,我做了以下的总结:
1、为什么要在html文件中写明字符集编码
网页中声明语言与编码是很重要的,如果网页文件中没有声明正确的编码,浏览器会根据浏览者计算机的设置显示编码。所以,我们浏览网页时,看到有些会出现乱码,通常是因为没有正确声明编码。
2、编码的类型
(1)、GBK编码,包括了GB2312中的编码,同时扩充了许多,通行于大陆。它是GB2312,一个简化字的编码规范,当然也包括其他的符号、字母、等,共7445个图形字符,其中汉字占6763个。
(2)、ASCII码。在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。
(3)、UTF-8。UTF-8就是在互联网上使用最广的一种unicode的实现方式。其他实现方式还包括UTF-16和UTF-32,不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8是Unicode的实现方式之一。
我们在写html文件时,最好是能习惯性的将编码格式写上,这样可以避免出现不尽人意的情况,当然,也可以选择在编辑中选择编码格式,但不排除有些编辑器的默认设置,与自己的文件编码格式不一致,此时就应当注意了,一定要保证文件的编码与设置的编码一致。