解决爬中文打印出乱码得问题

如下图,爬取标题,标题为中文内容,打印出乱码

解决方法,需要对请求后得返回数据重新编码

response = requests.get(url=url2)
response.encoding = ‘utf-8‘ #处理编码得步骤
print(url2)
wb_data = response.text # 将页面转换成文档树
html = etree.HTML(wb_data)
b = html.xpath(‘//div[@class = "picmainer"]/h1/text()‘)
b=(b[0])
print(b)
response.encoding = ‘utf-8‘ 

内容正常显示了

 

原文地址:https://www.cnblogs.com/becks/p/12687064.html

时间: 2024-10-18 21:46:04

解决爬中文打印出乱码得问题的相关文章

解决zabbix中文字体局部乱码问题

问题: 当zabbix的Web界面切换中文字体时,局部出现中文乱码: 原因: 1.初始化数据库的时候未使用utf8编码所致.初始化数据库使用命令     create database zabbix default charset utf8;     或者my.cnf增加如下配置     default-character-set = utf8 2.zabbix使用DejaVuSan.ttf字体,不支持中文,导致中文出现乱码. 解决(原因2): 从本地windows系统下载中文字体,例如楷体常规

原创:如何解决 传中文参数 显示乱码问题

前台: 1 <script type="text/javascript"> 2 $(document).ready(function(){ 3 $("#postButton").click(fuction(){ 4 var city="深圳市"; city=UrlEncode(city);//前台用js对中文进行一次编码 5 $.ajax({ 6 type:"GET", 7 url:root+"/getC

解决Ubuntu中文显示为乱码

1. 安装所需软件 sudo apt-get install zh-autoconvert sudo apt-get install zhcon 2. 配置系统 $ vi /var/lib/locales/supported.d/local 加入 zh_CN.GBK GBK zh_CN.GB2312 GB2312 $ sudo locale-gen 3. 修改ubuntu的字符集 方法一: 修改用户目录下的.profile或.bashrc文件,增加以下内容: LANGUAGE="zh_CN:zh

解决JSP中文乱码问题

大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着大家,现把JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考.首先了解一下Java中文问题的由来: Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦.原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题.首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流

转-Eclipse,tomcat及jsp页面编码的设定解决的中文乱码问题

一.Eclipse下编码的设定(在myeclipse下设定方法类似) 1.window -> Preferences -> general -> Workspace -> Text file encoding(这里是设置工作去的编码) 选择Other,将编码改变为UTF-8,这样以后新建立工程其属性对话框中的Text file encoding即为UTF-8. 2.window -> Preferences -> general -> Content Types(

Mac下eclipse导入其他工程中文注释出现乱码解决方案

因为用的是mac版的eclipse,导入其他工程注释出现乱码的情况,找了网上的很多方法,大部分都是说的workspace,在这里修改,但是我修改之后还是乱码,最后发现这样一个方法,才得以解决. 点击 偏好设置 -> General ->Text ->Java Source File  在下面的defalt encoding修改成  GBK,点击update 这样就解决了中文注释出现乱码的问题.

【linux】解决Wesnoth中文乱码问题

现在使用的系统是Linux Mint 18,安装了Wesnoth,发现打开之后部分中文显示正常,部分中文显示为乱码. 谷歌出的很多办法都只给出了几条指令,但并不具有普适性,我提供一种新的方法,通过修改配置文件来解决乱码问题. 步骤如下:1.列出所有字体 fc-list :lang=zh 使用指令列出所有中文字体,根据输出找到合适的字体,并复制. 2.复制字体文件 把字体文件复制到目录 /usr/share/games/wesnoth/1.12/fonts 3.更改字体配置文件 使用root权限打

Ubuntu14.04安装中文输入法以及解决Gedit中文乱码问题

1 设置中文显示环境 1. 打开System Settings 2. 打开Personal-> Language Support. 会弹出如下对话框,提示你“语言支持没安装完整”. 点击“Remind Me Later”. 3. 在“Language Support”中,点击“Install/Remove Languages”,在打开的窗口中,找到“Chinese(simplified)”并勾选上,点击“Apply Changes”. 4. 上面只是下载了语言包,还需要切换系统语言才能使之生效.

AJAX在Post中文的时候乱码的解决方法

加上设置字符编码的方法: response.setHeader("charset","gb2312"); ******************************************** 看到的说明原文如下: 用AJAX来GET回一个页面时,RESPONSETEXT里面的中文多半会出现乱码,这是因为xmlhttp在处理返回的responseText的时候,是把resposeBody按UTF-8编码进解码考形成的,如果服务器送出的确实是UTF-8的数据流的时候