python 之 解决中文字符异常

Python在执行过程中,常常出现不能读取中文路径名,表现为读取的路径是空或者直接报错(WindowsError: [Error 2]);也有时候出现不能正常输出中文字符串,编译器报错为(KeyError),这是编码出现了问题。这个时候在字符串后面添加转码操作即可。

详见源码示例如下

【中文字符串】

print '品牌id'.decode('utf-8')
print '\xe5\x93\x81\xe7\x89\x8cid'.decode('utf-8')

上面两行输出结果是一致的。

【中文路径读取文件】

# 获取当前路径下的文件夹
import numpy as np
from os.path import exists, isdir, basename, join, splitext
from glob import glob
data_path = 'F:\\wfpdm\\My_Proc_Data_ZXTZ\\美国数据库\\ 自相关特征\\'.decode('utf-8')
cat_paths = glob(data_path + "*")
cat_paths.sort()
cats = [basename(cat_path) for cat_path in cat_paths]

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-11-09 00:29:17

python 之 解决中文字符异常的相关文章

php的ord函数——解决中文字符截断问题

php的ord函数——解决中文字符截断问题 分类: PHP2014-11-26 12:11 1033人阅读 评论(0) 收藏 举报 utf8字符截取 函数是这样定义的: int ord ( string$string) 返回字符串 string 第一个字符的 ASCII 码值. 该函数是chr()的互补函数. 试一下: echo ord('我');这里只能返回230, 我是以u8保存的文件并输出的, 它得到的只有230, 而230转换成hex是e6,实际上utf-8中我的编码是e68891, 它

Python中解决中文乱码问题

乱码原因:因为你的文件声明为utf-8,并且也应该是用utf-8的编码保存的源文件.但是windows的本地默认编码是cp936,也就是gbk编码,所以在控制台直接打印utf-8的字符串当然是乱码了. 解决方法:在控制台打印的地方用一个转码就ok了,打印的时候这么写:print myname.decode('UTF-8').encode('GBK') 比较通用的方法应该是:import systype = sys.getfilesystemencoding()print myname.decod

Python中文字符问题

Python中对中文字符的操作时常会使程序出现乱码 不全然管用的处理方法: 读取数据时使用encode编码为Bytes以保护数据 使用时转化为string并使用decode解码 如: title = title_origin[0].encode('utf-8') title = str(title.decode('utf-8'))

PostgreSQL Excel包含中文字符的数据导入方法

1.excel文件处理 删除掉标题行,另存为 以逗号分隔符的CSV文件 2.文件格式处理Notepad ++ 1).文件转换为UNIX格式 2).格式转换为UTF8无BOM 3.上传到数据库导入 注意事项: 1).字符集配置,操作系统字符集LANG=en_US.UTF-8 数据库字符集UTF-8 uccc_im=# \l List of databases Name    |  Owner   | Encoding |   Collate   |    Ctype    |   Access p

Servlet & JSP - 中文字符问题

Servlet 中的中文字符 来自 URL 参数部分的中文字符 Tomcat 默认接收数据的编码是 ISO-8859-1.所以当请求 URL 的参数部分含有中文字符,需要转换字符的编码. Enumeration<String> paramNames = req.getParameterNames(); while (paramNames.hasMoreElements()) { String paramName = (String) paramNames.nextElement(); Stri

14种解决web字符编码问题

解决中文字符乱码的问题大致分为以下这几种: 1.jsp 页眉 设置 pageEncoding 为 "utf-8" 2..jsp 页眉 设置 contentType="text/html;charset=UTF-8" 3.Window >>> preferences >>> Workspace 工作区设置 编码格式:UTF-8 4.Window >>> preferences >>> Genera

【已解决】python中文字符乱码(GB2312,GBK,GB18030相关的问题)

http://againinput4.blog.163.com/blog/static/1727994912011111011432810/ [背景] 在玩wordpress的一个博客搬家工具BlogMover,其包含几个python脚本,其中有个是163博客搬家用的163-blog-mover.py,实现抓取网易博客的日志,然后导出xml. 但是其工具现在(2011-12-10)已经失效了.经过自己一点修改后,可以实现获得文章标题了. 用法还是原先的用法:  163-blog-mover.py

python中文字符乱码(GB2312,GBK,GB18030相关的问题)

转自博主 crifan http://againinput4.blog.163.com/blog/static/1727994912011111011432810/ 在玩wordpress的一个博客搬家工具BlogMover,其包含几个python脚本,其中有个是163博客搬家用的163-blog-mover.py,实现抓取网易博客的日志,然后导出xml. 但是其工具现在(2011-12-10)已经失效了.经过自己一点修改后,可以实现获得文章标题了. 用法还是原先的用法:  163-blog-m

解决Python操作MySQL中文乱码的问题

原始代码: import os, sys, string import MySQLdb MYSQL_HOST = 'localhost' MYSQL_PORT = '3306' MYSQL_USER = 'root' MYSQL_PASS = '' MYSQL_DB = 'app_hwms' def main(): try: conn = MySQLdb.connect(host=MYSQL_HOST,user=MYSQL_USER ,passwd=MYSQL_PASS,db=MYSQL_DB)