编码部分历史及python文件编码简介

UTF-8 = unicode的扩展集,可变长的字符编码集

ascii --> gb2312 --> gbk1.0 -->gb18030

ascii --> unicode --> utf-8

Python2.x == ascii是其默认编码

如果在2.x中需要使用utf-8,需要以下声明:

#!-*- coding:utf-8 -*-

#coding:utf-8

Python3.x == unicode是其默认编码

unicode是向下兼容gb2312和gbk

原文地址:http://blog.51cto.com/13467494/2103105

时间: 2024-10-03 12:54:47

编码部分历史及python文件编码简介的相关文章

python文件编码说明 coding=utf-8

python 支持3种编码声明,一般常用能见到下面两种 1.# -*- coding: utf-8 -*- 这种写法是为了兼容Emacs的编码声明 2.短一点,但Emacs不能用# coding=utf-8 短一点,但Emacs不能用 之所以要声明未编码类型 ,主要是中文出错的问题. 在python 文件开头(一般是第一行或第二行),用来说明你的Python源程序文件用使用的编码.缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的

Python 文件编码问题解决

最近使用python操作文件,经常遇到编码错误的问题,例如: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 350: in 我看百度的解决方法就是手动指定编码方式,类似于以下这种方式: encoding="UTF-8" 虽然这种类似的方法也能解决.但是这种方法只能靠运气去碰,如果刚好碰到文件编码和你指定的编码一致,那么就不会报错了.这种方式在尝试的过程就会很麻烦. 这里就有一个解决的小技巧,我们

批量编码转化工具(实现文件编码的自动检测)

先看截图 工具对.c,.h,.cpp,.txt文件进行转换,其余类型文件,则仅仅拷贝到转换后的输出路径.这种处理是为了转换前和转换后的项目结构保持不变. 工具中一个重要的部分,是对文件编码的自动检测(选项为Auto的情况) 此部分使用了第三方组件(NonCodeNet) 调用代码如下: public string getFileEncoding(string filePath) { string uni = string.Empty; Stream stream = File.Open(file

python文件编码说明 coding

权威来源:http://www.python.org/dev/peps/pep-0263/Python源文件的头部声明(声明在文件的第一行或第二行) # coding=utf-8 # coding:utf-8 # -*- coding:utf-8 -*- 要符合正则规范"coding[:=]\s*([-\w.]+)"  注意 :或=前后没有空格 Defining the Encoding Python will default to ASCII as standard encoding

Python学习笔记八:文件操作(续),文件编码与解码,函数,递归,函数式编程介绍,高阶函数

文件操作(续) 获得文件句柄位置,f.tell(),从0开始,按字符数计数 f.read(5),读取5个字符 返回文件句柄到某位置,f.seek(0) 文件在编辑过程中改变编码,f.detech() 获取文件编码,f.encoding() 获取文件在内存中的编号,f.fileno() 获取文件终端类型(tty.打印机等),f.isatty() 获取文件名,f.name() 判断文件句柄是否可移动(tty等不可移动),f.seekable() 判断文件是否可读,f.readable() 判断文件是

【转载】关于Python脚本开头两行的:#!/usr/bin/python和# -*- coding: utf-8 -*-的作用 – 指定文件编码类型

下面的内容来自:http://www.cnblogs.com/blueskylcc/p/5332642.html, 对方也是转的,不过没有找到转载的出处: 1.#!/usr/bin/python 是用来说明脚本语言是 python 的 是要用 /usr/bin下面的程序(工具)python,这个解释器,来解释 python 脚本,来运行 python 脚本的. 2.# -*- coding: utf-8 -*- 是用来指定文件编码为 utf-8 的 详情可以参考:PEP 0263 - Defin

转载、Python的编码处理(二)

以下转自于:wklken的博客,写的非常好的一段有关编码的总结. Python-进阶-编码处理小结 整理下python编码相关的内容 注意: 以下讨论为Python2.x版本, Py3k的待尝试 开始 用python处理中文时,读取文件或消息,http参数等等 一运行,发现乱码(字符串处理,读写文件,print) 然后,大多数人的做法是,调用encode/decode进行调试,并没有明确思考为何出现乱码 所以调试时最常出现的错误 错误1 Traceback (most recent call l

关于Python字符编码encode和decode

(注:本文部分内容摘自互联网,由于作者水平有限,不足之处,还望留言指正.) 记得几天前,部门的一个小姑娘问我,怎么她Python打印出来的中文信息都乱码了?我走过去,略思一二,瞬间给她搞定,其实这是字符编码转换的问题.这时,我注意到小姑娘流露出一丝丝崇拜的眼神.所以我想,如果你连编码问题都搞不定,还怎么泡妞啊.可能一部分人也会进入这种误区,我以我小学生的水平,把我的理解结合网上的资料写下来. 注意:Python3默认编码是unicode:而Python2是ASCII码.Windows环境默认是g

Linux下查看文件编码,文件编码格式转换和文件名编码转换

linux相关   2008-10-07 10:46   阅读1392   评论0   字号: 大大  中中  小小  如果你需要在Linux中 操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中默认的文件格式是GBK(gb2312),而Linux一般都是 UTF-8.下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换. 查看文件编码 在Linux中查看文件编码可以通过以下几种方式: 1.在Vim中可以直接查看文件编码 :set file