刚刚入坑Pycharm,试了个简单爬取网页:
# -*- coding:gbk -*-
import urllib.request
res=urllib.request.urlopen("http://www.sina.com.cn/")
print(res.read())
结果控制台输出中文变成了unicode编码。
最后read()改成read().decode()解决
# -*- coding:gbk -*-
import urllib.request
res=urllib.request.urlopen("http://www.sina.com.cn/")
print(res.read().decode())
原文地址:https://www.cnblogs.com/fgfg/p/9177085.html
时间: 2024-10-10 02:00:40