Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题

1、被这个问题折腾了一上午终于解决了，再网上看到有用 string.replace(u‘\xa0‘,u‘ ‘) 替换成空格的，方法试了没用。

后来发现要在open的时候加utf-8才解决问题。

以为就这样万事大吉了，运行又出现新问题了，爬去的内容是乱码，而源码是正常的，这不是怪了嘛，想想肯定是页面没用utf-8

把utf-8 加上之后，问题完美解决

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题

时间： 2024-10-12 22:53:13

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题的相关文章

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence

UnicodeEncodeError Traceback (most recent call last) <ipython-input-95-45a7accf2da0> in <module> 1 fout = open('job_desc.txt', 'wt') 2 for info in job_desc: ----> 3 fout.write("{},\"{}\"\n".format(info[0],info[1].replace

20170427报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position

今天写python,将网上数据流编写进文件里时遇到的,网上搜到结果并正确的进行了处理,把原文解决方法拷过来了,嘿嘿使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position - 这个问题. 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的.

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 46:illegal multibyte sequence

最近使用python写入文件时,出现了如下的错误: 但是content的内容是unicode编码,不知道怎么和gbk扯上了关系,对content使用encode()和decode(),用gbk,utf-8,gb2312各种编码解码都没有效果: 在网上查找资料,看到一篇文章关于这个的说法:http://blog.csdn.net/xiaoyi_zhang/article/details/51675099 结论是: 1.'gbk' codec can't encode character :说明是将

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence

在爬取 url = "http://stats.meizhou.gov.cn/show/index/1543/1689" 时出现了问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence 解决方案: (待解决) UnicodeEncodeError: 'gbk' codec can't encode character '\

【编码】UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX

有时候在win中运行代码会遇到题目中的报错问题: "UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX",让人摸不着头脑的是程序开头的编码设置# coding:utf-8 和数据流IO操作时的编码转化都已经在程序中加入加入了.gbk哪里来的呢?其实就是win中新文件的默认编码是gbk. 当我们遇到编码问题的时候,有三个地方需要注意的:文件的编码,IDE的编码,还有数据流IO操作过程中

[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

问题: cmd里直接print的时候报错之前已经测试了一个页面,编码没有问题.这是在爬类似页面的时候报的错思路: 因为这个看上去不是整体的编码问题,所以我直接查看了报错的字符编码'\xa0',发现这个是unicode下的'&nbps',而这个编码不存在于gbk里尝试: replace(u'\xa0', u' ') - 报同一个错,不知道为什么... encode('gbk', 'ignore').decode('gbk') - 解决 [python3 - TroubleShooting]

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题的相关文章

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence

20170427报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 46:illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence

【编码】UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX

[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

day1 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2490: illegal multibyte sequence 错误提示

【python】Python3中出现'gbk' codec can't encode characte的成功解决方法？

Python读取中文txt文件错误：UnicodeEncodeError: 'gbk' codec can't encode character