Python 2.7 学习笔记中文处理

首先我们在编写python代码文件时，文件本身会采用一种编码格式，如 utf-8 或 gbk

这时我们需要在python文件的开头设置文件的编码格式，以告诉编译器。

如果文件的编码格式是 utf-8, 则在文件的第一行需要添加如下语句

#coding=utf-8

如果文件的编码格式是 utf-8, 则在文件的第一行需要添加如下语句

#coding=gbk

如果设置为utf-8的格式，在linux执行，中文处理，包括显示没任何问题。

但是如果设置为utf-8的格式，在window下，在命令行下执行时，发现利用 print打印中文会出现乱码。

原因是因为，虽然文件声明为utf-8，且用utf-8的编码保存的源文件。但是windows的(www.111cn.net)本地默认编码是cp936，也就是gbk编码，所以在控制台直接打印utf-8的字符串就显示乱码了。注意，实际上只是显示有问题，入库等处理并没问题。

这有两种解决方案。

一、方案一：

将文件的编码格式改为gbk，并在文件的第一行改为#coding=gbk，这时处理中文就没问题。

但这个方案带来的问题，如果该文件放到Linux下可能会显示出问题。因为一般linux机器下没有gbk的字符集。

二、方案二

文件还是采用utf-8的编码，文件头的第一行依然是#coding=utf-8

这时在print 中文时需要进行下编码，代码如：

print "中文".decode(‘utf-8‘).encode(sys.getfilesystemencoding())

注意：因为用到了sys模块，需要在语句执行添加 import sys

这样带来的问题，print语句比较臃肿，可以考虑自己封装下.

时间： 2024-11-07 21:32:55

Python 2.7 学习笔记中文处理的相关文章

python网络爬虫学习笔记

python网络爬虫学习笔记 By 钟桓 9月 4 2014 更新日期:9月 4 2014 文章目录 1. 介绍: 2. 从简单语句中开始: 3. 传送数据给服务器 4. HTTP头-描述数据的数据 5. 异常 5.0.1. URLError 5.0.2. HTTPError 5.0.3. 处理异常 5.0.4. info和geturl 6. Opener和Handler 7. Basic Authentication 8. 代理 9. Timeout 设置 10. Cookie 11. Deb

python数据分析入门学习笔记儿

学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘

<<Python基础教程>>学习笔记之|第01章|基础知识

本学习笔记主要用要记录下学习<<Python基础教程>>过程中的一些Key Point,或自己没怎么搞明白的内容,可能有点杂乱,但比较实用,查找起来也方便. 第01章:基础知识 ------ Jython: Python的Java实现,运行在JVM中,相对稳定,但落后于Python,当前版本2.5,在TA(Python+Robot)会用到 IronPython: Python的C#实现,运行在Common Language Runtime,速度比Python要快 >

Python高级特性——学习笔记

Python中非常有用的高级特性,1行代码能实现的功能,决不写5行代码.请始终牢记,代码越少,开发效率越高. 1.切片slice.L = [1, 2, 3, 4, 5] L[0:3]=[1,2,3]表示,从索引0开始取,直到索引3为止,但不包括索引3.即索引0,1,2,正好是3个元素. 如果第一个索引是0,还可以省略倒数切片L[-2:]=[4,5]从倒数第二个数到最后一个数 L = list(range(100))# 创建一个0-99的数列L L[:10:2]# 前10个数,每两个取一个

基于python的接口测试学习笔记一（初出茅庐）

第一次写博客笔记,讲一下近来学习的接口自动化测试.网上查阅了相关资料,最后决定使用python语言写接口测试,使用的是python的第三方库requests.虽然python本身标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能.但requests更好用简单.果断入门学习. 新手入门,代码比较简单 import requests import unittest class apiTest(unittest.TestCase): def setUp(self): self.ba

Python 第一周学习笔记

1.Python 解释器 #!/usr/bin/env python # -*- coding:utf-8 -*- # Author:Tian Ba Python3 字符集默认支持中文 2.变量定义的规则: .变量名只能是字母.数字或下划线的任意组合 .变量名的第一个字符不能是数字 3.字符串所有带引号的都是字符串,包含(单引号,双引号,三引号) 4.注释当行注释:#被注释内容多行注释:"""被注释内容""" (可以是单引号或者是双引号)

python web框架学习笔记

一.web框架本质 1.基于socket,自己处理请求 #!/usr/bin/env python3 #coding:utf8 import socket def handle_request(client): #接收请求 buf = client.recv(1024) print(buf) #返回信息 client.send(bytes('<h1>welcome liuyao webserver</h1>','utf8')) def main(): #创建sock对象 sock

Python(Head First)学习笔记：四

4 持久存储:文件存储.读写数据保存到文件:在学习的过程中出现了一个问题,老是报一个错:SyntaxError: invalid syntax: 这个是语法错误,后来搜了下才知道是python2.7和python3.5并不兼容,因为之前一直是在ubuntu的终端里写这些简单的实例,后来程序稍微大点就不方便了,就安装了idle,用命令:sudo apt-get install idle,安装完启动后, 载入python文件,然后运行发现是python2.7,然后逐行运行,发现报错,而之前这些代

python requests库学习笔记（上）

尊重博客园原创精神,请勿转载! requests库官方使用手册地址:http://www.python-requests.org/en/master/:中文使用手册地址:http://cn.python-requests.org/zh_CN/latest/: requests库作者Kenneth Reitz个人主页:https://www.kennethreitz.org/: requests库github地址:https://github.com/requests/requests: requ

Python 2.7 学习笔记 中文处理

Python 2.7 学习笔记 中文处理的相关文章

Python 2.7 学习笔记中文处理

Python 2.7 学习笔记中文处理的相关文章