day03_09 编码部分历史及文件编码简介

详细课件:http://www.cnblogs.com/alex3714/articles/5465198.html

字符编码

支持中文的第一张表就是GB2312

1980 gb2312 6700+

1995 gbk1.0 20000

2000 gb18030 27000

big5 台湾

unicode 万国码支持所有国家和地区的编码

2^16 = 65535 = 存一个字符统一占用2个字节

为了解决字符字节翻倍的问题,出现了UTF-8

UTF-8 = unicode 的扩展及,可变长的字符编码集

ASSIC==>GB2312==>GBK1.0==>GB18030

ASSIC==>UNICODE==>UTF-8

python3.0默认编码是nuicode支持中文

python2.0默认编码默认是ASSIC

如果用python2执行以下代码会报错,因为不支持中文,所以需要加上一行红色代码,终于搞懂为什么不需要在python3中加上这行代码了

#!-*- coding:utf-8 -*-
print "我爱北京天安门!"

windows默认编码是GBK,所以看UTF-8就看不了,所以出现以上错误乱码

解决方法:2种类

#!-*- coding:gbk -*-
print "我爱北京天安门!"

但是如果你使用notepad++的话,默认是utf-8,所以还需要转换一下才行

所以最好不要使用notepad++这个恶心的编辑器...这个编辑器最大的问题就是编码问题,fuck notepad++

因为unicode是向下兼容gb2312的,所以以下代码前加上u,就是可以直接显示中文了

#!-*- coding:utf-8-*-
print  u"我爱北京天安门"

另外一种编码的写法

#coding:utf-8
print  "我爱北京天安门"

把cmd编码还原成GBK格式,在cmd命令行中输入chcp 936

时间： 2024-10-28 09:19:39

day03_09 编码部分历史及文件编码简介的相关文章

Linux下查看文件编码,文件编码格式转换和文件名编码转换

linux相关 2008-10-07 10:46 阅读1392 评论0 字号: 大大中中小小如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中默认的文件格式是GBK(gb2312),而Linux一般都是 UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码在Linux中查看文件编码可以通过以下几种方式: 1.在Vim中可以直接查看文件编码 :set file

Python学习笔记八：文件操作（续），文件编码与解码，函数，递归，函数式编程介绍，高阶函数

文件操作(续) 获得文件句柄位置,f.tell(),从0开始,按字符数计数 f.read(5),读取5个字符返回文件句柄到某位置,f.seek(0) 文件在编辑过程中改变编码,f.detech() 获取文件编码,f.encoding() 获取文件在内存中的编号,f.fileno() 获取文件终端类型(tty.打印机等),f.isatty() 获取文件名,f.name() 判断文件句柄是否可移动(tty等不可移动),f.seekable() 判断文件是否可读,f.readable() 判断文件是

【转载】关于Python脚本开头两行的：#!/usr/bin/python和# -- coding: utf-8 --的作用 – 指定文件编码类型

下面的内容来自:http://www.cnblogs.com/blueskylcc/p/5332642.html, 对方也是转的,不过没有找到转载的出处: 1.#!/usr/bin/python 是用来说明脚本语言是 python 的是要用 /usr/bin下面的程序(工具)python,这个解释器,来解释 python 脚本,来运行 python 脚本的. 2.# -*- coding: utf-8 -*- 是用来指定文件编码为 utf-8 的详情可以参考:PEP 0263 - Defin

(转)剖析Linux文件编码的查看及修改

Linux文件编码的查看和修改都有不止一种做法,如果你需要在Linux中操作windows下的文件,那么很可能会经常遇到文件编码转换的问题,如何进行这项工作,也应该是经常工作在双系统下的操作者的必须掌握的知识. Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码在Linux中查看文件编码可以通过以下几种方式: 1.在Vim中可以直接查看文件编码 :set fileen

Linux查看文件编码格式及文件编码转换

Linux查看文件编码格式及文件编码转换如果你需要在Linux 中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码在Linux中查看文件编码可以通过以下几种方式:1.在Vim 中可以直接查看文件编码 Shell代码 :set fileencoding 即可显示文件编码格式.如果你只是想查看其它编码格

Linux解决乱码问题以及查看文件编码方式

在linux下操作windows下的文件,经常遇到文件乱码,现在就是不知道能不能改变linux系统的编码,就不要再对文件进行编码转换了下面是昨天看的一点资料如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接

C# IO操作（四）大文件拷贝（文件流的使用）、文件编码

大文件拷贝(文件流的使用).文件编码首先说一下大文件拷贝和文件流,因为计算机的内存资源是有限的,面对几个G甚至更大的文件,需要通过程序来完成拷贝,就需要用到文件流(因为我们无法做到把文件一次性加载到内存中:事实上,内存也不允许这么干),所以在C#中出现了内存流这个东西.先看下面的内容,File类中的常用读取文件方法会将文件内容一次性全部加载到内存中: 1 string sPath = @"C:\Users\Chens-PC\Desktop\Nginx.txt"; 2 //F

VIM查看文件编码文件编码格式转换文件名编码转换.

如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接查看文件编码:set fileencoding即可显示文件编码格式.如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在~/.v

centos 文件编码转换命令

从Linux往windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码. convmv -f 源编码 -t 新编码 [选项] 文件名常用参数: -r 递归处理子文件夹 --notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验. --list