python 中文乱码问题解决方案

最近在项目中部署结巴分词的时候遇到了乱码情况,明明是中文,确显示不出来或者显示乱码。解决方案如下。

利用isinstance 来判断是否已经编码,s是出问题的字符串。unicode是没编码

isinstance(s, unicode):

用print 打印,如果结果是true说明没编码。如果是false说明编码了,但是编的码不对

print isinstance(s,unicode)

如果没编码,加入编码

s.encode(‘UTF-8‘)

如果编码了,编错了,就先解码再编

s.decode(‘utf-8‘).encode(‘gb2312‘)

参考:http://www.jb51.net/article/17560.htm

/********************************

* 本文来自博客  “李博Garvin“

* 转载请标明出处:http://blog.csdn.net/buptgshengod

******************************************/

时间: 2024-08-29 13:03:50

python 中文乱码问题解决方案的相关文章

eclipse 编辑 python 中文乱码的解决方案

今天在学习python时做了一个用户输入一个目录地址,再输入内容,然后将输入的内容存入输入的目录文件中: 具体代码如下: #coding:utf-8 ''' Created on 2014-12-17 @author: huhao ''' import os #字符串给出当前平台使用的行终止符 #Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'. 后面换行使用 ls = os.linesep while True: fname = raw_input("enter:&q

Eclipse工程,中文乱码问题解决方案

Eclipse工程,中文乱码问题解决方案 将工程的属性设置为GBK: 如果一个工程家里的时候是按照GBK,而Eclipse默认的编码是UTF-8,所以如果导入的工程是GBK,则可以将工程更改为UTF-8试试: 如果还是不行的话,暂时无法解决,百度无数,基本上都是说编码问题,只是我自己也碰到过更改编码格式为GBK/UTF-8依然解决不了问题的情况.

JSP中文乱码问题解决方案

1.项目工程编码统一采用UTF-8编码 2.JSP页面采用UTF-8编码 <%@ page language="java" import="java.util.*,entity.Student" pageEncoding="UTF-8"%> 3.设置request内置对象采用utf-8编码,防止表单提交产生信息乱码(POST方式提交) request.setCharacterEncoding("utf-8"); 4

在jQuery中Ajax的Post提交中文乱码的解决方案(转)

引言: 在jQuery的Ajax POST请求中,进行请求,其中的中文在后台,显示为乱码,该如何解决呢? 问题的引入: var regid = $('#oregion').combobox('getValue'); //var sname = $('#sname').val(); var sname = encodeURI($('#sname').val(),"UTF-8"); if(regid!=""&&regid!='undefined'){ $

Python中文乱码问题

1:源代码 #!/usr/bin/env python name = raw_input('请输入您的姓名:') print 'Hello,', name 运行时出错: [email protected]:~/my_note/my_python$ python 5.py File "5.py", line 3 SyntaxError: Non-ASCII character '\xe8' in file 5.py on line 3, but no encoding declared;

中文乱码问题解决方案

UTF-8编码与GBK,GB2312编码区别 UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码.UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GBK是国家

Spring MVC 结合Velocity视图出现中文乱码的解决方案

编码问题一直是个很令人头疼的事,这几天搭了一个Spring MVC+VTL的web框架,发现中文乱码了,这里记录一种解决乱码的方案. 开发环境为eclipse,首先,检查Window->preferences->workplace->Text File Encoding,设置为GBK .vm文件中加入编码约束,举例如下 <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Typ

最近在调用 calendar.js 的时候出现中文乱码! 解决方案

最近写一个小项目的时候:在调用 calendar.js  的时候出现中文乱码! 如图所示: 原因在于: 我的jsp 页面,指定的是 UTF-8 编码,然而,调用的 calendar.js 的编码确实 GBK 编码,所以出现上面的结果. 解决方案: 再引入 JS文件的时候,指定 编码格式: 例如: <script type="text/javascript" src="<%=path %>/admin/images/calendar.js"  cha

Java中文乱码&amp;特殊字符解决方案

Java中文乱码&特殊字符解决方案 相信很多朋友遇到过Java的乱码问题,最近我也在解决一个"使用文本生成图片过程中中文以及特殊字符乱码"的问题:花了我大量时间,Debug了sun.font.sun.awt下面的各种源码,终于搞懂了其机制,解决了目前次问题:现在把问题解决过程给写下来,做个记录,以免以后再次遇到. 遇到的问题 下面是我想要执行的代码(经过极度简化,但是意思没变): 1 public static void main(String[] args) throws I