Python3.x:BeautifulSoup()解决中文乱码问题
问题:
BeautifulSoup获取网页内容,中文显示乱码;
解决方案:
import requests from bs4 import BeautifulSoup html = requests.get(url, headers=Hostreferer) soup = BeautifulSoup(html.content, "html.parser", fromEncoding="gb18030")
如果中文页面编码是gb2312,gbk,在BeautifulSoup构造器中传入fromEncoding="gb18030"参数即可解决乱码问题,
即使分析的页面是utf8的页面使用gb18030也不会出现乱码问题;
原文地址:https://www.cnblogs.com/lizm166/p/8319919.html
时间: 2024-09-30 15:03:50