UnicodeEncodeError: 'gbk' codec can't encode character '\xee'

  在将爬取到的内容写入文件时候报了这个错误,解决方案是在open()的时候给encoding参数传‘utf-8‘就好了,因为网页的编码就是utf-8。

1 with open(‘douban.html‘,‘w‘,encoding=‘utf-8‘) as f:
2      f.write(res.text)

UnicodeEncodeError: 'gbk' codec can't encode character '\xee'

原文地址:https://www.cnblogs.com/zzqc/p/10259487.html

时间: 2024-07-29 13:28:00

UnicodeEncodeError: 'gbk' codec can't encode character '\xee'的相关文章

20170427报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position

今天写python,将网上数据流编写进文件里时遇到的,网上搜到结果并正确的进行了处理,把原文解决方法拷过来了,嘿嘿 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position - 这个问题. 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的.

UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200e’ in position 43: illegal multibyte sequence

[问题] python中已获取网页: http://blog.csdn.net/hfahe/article/details/5494895 的html源码,其时UTF-8编码的. 提取出其标题部分: <span class="link_title"><a href="/hfahe/article/details/5494895"> 在2008 Beijing Perl 大会的演讲-使用Mason开发高性能的Web站点‎ </a>&

[python]UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character 解决方法

在windows下面编写python脚本,编码问题很严重. 将网络数据流写入文件时时,我们会遇到几个编码: 1: #encoding='XXX' 这里(也就是python文件第一行的内容)的编码是指该python脚本文件本身的编码,无关紧要.只要XXX和文件本身的编码相同就行了. 比如notepad++ "格式"菜单里面里可以设置各种编码,这时需要保证该菜单里设置的编码和encoding XXX相同就行了,不同的话会报错 2:网络数据流的编码 比如获取网页,那么网络数据流的编码就是网页

Python读取中文txt文件错误:UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character

1 with open(file,'r') as f: 2 line=f.readline() 3 i=1 4 while line: 5 line=line.decode('utf-8') 6 print str(i)+": "+line7 line=f.readline() 8 i=i+1 用以上代码读取一个包含中文的txt文件时,在正确地读取并打印了六百多行之后,print str(i)+": "+line这一行报错: UnicodeEncodeError:

解决“UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character u&#39;\xa9&#39; in position 24051: illegal multibyte sequence”错误

今天我在爬取一个网页时出现了下面这个错误: UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence 从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法: source_code.encode('GB18030') 解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符. 解决"UnicodeEncode

day1 UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 2490: illegal multibyte sequence 错误提示

get方式得到网页的信息 #coding=utf-8 #pip install requests #直接get到网页的信息 import requests from bs4 import BeautifulSoup response = requests.get('https://www.sogou.com/web?query=搞基建') print(response.text) #打印搜索出来的全部信息 #从 response.text 找出 <div class = 'wrwrap> &l

UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 46:illegal multibyte sequence

最近使用python写入文件时,出现了如下的错误: 但是content的内容是unicode编码,不知道怎么和gbk扯上了关系,对content使用encode()和decode(),用gbk,utf-8,gb2312各种编码解码都没有效果: 在网上查找资料,看到一篇文章关于这个的说法:http://blog.csdn.net/xiaoyi_zhang/article/details/51675099 结论是: 1.'gbk' codec can't encode character :说明是将

UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 1987: illegal multibyte sequence

在爬取 url = "http://stats.meizhou.gov.cn/show/index/1543/1689" 时出现了问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence 解决方案: (待解决) UnicodeEncodeError: 'gbk' codec can't encode character '\

[python3 - TroubleShooting] UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 27: illegal multibyte sequence

问题: cmd里直接print的时候报错 之前已经测试了一个页面,编码没有问题.这是在爬类似页面的时候报的错 思路: 因为这个看上去不是整体的编码问题,所以我直接查看了报错的字符编码'\xa0',发现这个是unicode下的'&nbps',而这个编码不存在于gbk里 尝试: replace(u'\xa0', u' ') - 报同一个错,不知道为什么... encode('gbk', 'ignore').decode('gbk') - 解决 [python3 - TroubleShooting]