day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示

get方式得到网页的信息

#coding=utf-8
#pip install requests

#直接get到网页的信息
import requests
from bs4 import BeautifulSoup

response = requests.get(‘https://www.sogou.com/web?query=搞基建‘)
print(response.text)  #打印搜索出来的全部信息

#从 response.text  找出   <div class = ‘wrwrap> </div>
soup = BeautifulSoup(response.text,‘html.parser‘)
new_list = soup.find_all(name=‘div‘,class_=‘vrwrap‘)
print(new_list)

#可以继续从 <div class = ‘wrwrap> </div>  继续查找

1.错误代码

Traceback (most recent call last):
  File "D:/PycharmProjects/爬虫/day1/s1.py", line 12, in <module>
    print(new_list)
UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 2490: illegal multibyte sequence

2.编码格式不对

3.全部改为utf-8

4.执行成功

day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示

时间： 2024-10-09 03:45:44

day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示的相关文章

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 46:illegal multibyte sequence

最近使用python写入文件时,出现了如下的错误: 但是content的内容是unicode编码,不知道怎么和gbk扯上了关系,对content使用encode()和decode(),用gbk,utf-8,gb2312各种编码解码都没有效果: 在网上查找资料,看到一篇文章关于这个的说法:http://blog.csdn.net/xiaoyi_zhang/article/details/51675099 结论是: 1.'gbk' codec can't encode character :说明是将

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence

在爬取 url = "http://stats.meizhou.gov.cn/show/index/1543/1689" 时出现了问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence 解决方案: (待解决) UnicodeEncodeError: 'gbk' codec can't encode character '\

[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

问题: cmd里直接print的时候报错之前已经测试了一个页面,编码没有问题.这是在爬类似页面的时候报的错思路: 因为这个看上去不是整体的编码问题,所以我直接查看了报错的字符编码'\xa0',发现这个是unicode下的'&nbps',而这个编码不存在于gbk里尝试: replace(u'\xa0', u' ') - 报同一个错,不知道为什么... encode('gbk', 'ignore').decode('gbk') - 解决 [python3 - TroubleShooting]

day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示

day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示的相关文章

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 46:illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence

[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 3: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\u25aa' in position 15: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\ufeff' in position 0: illegal multibyte sequence

20170427报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position

【编码】UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX