Pycharm控制台中文变成unicode编码解决办法

刚刚入坑Pycharm,试了个简单爬取网页:

# -*- coding:gbk -*-
import urllib.request
res=urllib.request.urlopen("http://www.sina.com.cn/")
print(res.read())

结果控制台输出中文变成了unicode编码。

最后read()改成read().decode()解决

# -*- coding:gbk -*-
import urllib.request
res=urllib.request.urlopen("http://www.sina.com.cn/")
print(res.read().decode())

原文地址:https://www.cnblogs.com/fgfg/p/9177085.html

时间: 2024-10-10 02:00:40

Pycharm控制台中文变成unicode编码解决办法的相关文章

php输出json中文显示编码-解决办法

$str = "中华人民共和国";$ar = array( "a" => "a0", "b" => "b0", "c" => "c0", "d" => "d0", "e" => $str, );echo preg_replace("#\\\u([0-9a-f]{4})#

get/post时中文乱码问题的解决办法

常有的方法,get请求用在tomcat的编码改为utf-8 即可 post 过滤器就可以 一.常识了解 1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码: 3.getBytes() 是通过平台默认字符集进行编码: 二.中文乱码出现 在学习任何一门技术时,经常会有初学者遇到中文乱码问题,比如MySQL,是因为在安装时没有设置:而在Servlet中

codeblocks中文乱码原因及解决办法

原因:(本地化做得不够好)默认情况下codeblocks编辑器保存源文件是保存为windows本地编码,就是WINDOWS-936字符集,即GBK:但CB的编辑器在默认编辑的时候是按照UTF-8来解析的,由于源文件的编码与编辑器的编码没有统一好,从而造成代码中的中文字符乱码. 解决办法:只要将源文件的编码与编辑器的解析编码统一即可,具体步骤如下①setting→editor→encoding setting→选择WINDOWS-936与As default encoding ②setting→c

Source Insight 中文注释为乱码解决办法(完美解决,一键搞定)【转】

转自:http://blog.csdn.net/bjarnecpp/article/details/70174752 版权声明:本文为博主原创文章,未经博主允许不得转载. Source Insight中文注释为乱码解决办法 我网上查了一堆解决办法,但是都是2017年以前的,并且都是针对于source insight 3.5及以下版本的解决方案,软件版本都到4.0了,应该有新方法出现. —————————————————————————————————————— 干货:Source Insight

常用中文字体 Unicode 编码

各大网站的字体选择 网站 字体 腾讯 font: 12px "宋体","Arial Narrow",HELVETICA; 淘宝 font: 12px/1.5 tahoma,arial,'Hiragino Sans GB',\5b8b\4f53,sans-serif; 蘑菇街 font: 12px/1.6 tahoma,arial,sans-serif; SegmentFault font-family: "Helvetica Neue",Helv

CString的中文显示乱码的解决办法

1.加头文件#include <locale.h> 2.在文件打开 CStdioFile file;    CFileException exp;之后加上:    char* old_locale=_strdup(setlocale(LC_CTYPE,NULL) );    setlocale( LC_CTYPE,"chs"); 3.在文件读取结束加上 setlocale( LC_CTYPE, old_locale ); //还原语言区域的设置    free( old_l

js中文转Unicode编码与解码

中文转为unicode 编码: function encodeUnicode(str) { var res = []; for (var i = 0; i < str.length; i++) { res[i] = ( "00" + str.charCodeAt(i).toString(16) ).slice(-4); } return "\\u" + res.join("\\u"); } unicode编码解码为中文: function

eclipse中文乱码问题的解决办法

今天下午纠结这个乱码问题.简直要醉了. 网上有很多类似的问题,类似的解决办法. 至于有效性,其实也多为一个运气.因为谁知道eclipse的编码机制呢. 导入别人的项目,难免遇到几个中文汉字.真遇到怎么办呢. 1. 先检查原.zip或.tar文件是否受损.办法:解压后,用记事本打开.java文件.无乱码说明该文件未受损.可另存为,查看它的编码方式A(utf-8或其他). 2. 导入包后,jre环境配置好后,右击项目查看其默认编码方式(一般utf-8或gbk). 3. 若.java文件打开有乱码出现

jQuery使用serialize()表单序列化时出现中文乱码问题的解决办法

序列化中文时之所以乱码是因为.serialize()调用了encodeURLComponent方法将数据编码了 解决方法就是进行解码 原因:.serialize()自动调用了encodeURIComponent方法将数据编码了 解决方法:调用decodeURIComponent(XXX,true);将数据解码 //商品标签function tag(url){ var form = $('form').serialize(); //序列化内容 var shuju = decodeURICompon