Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题



1、被这个问题折腾了一上午终于解决了,再网上看到有用  string.replace(u‘\xa0‘,u‘ ‘) 替换成空格的,方法试了没用。

后来发现 要在open的时候加utf-8才解决问题。

以为就这样万事大吉了,运行又出现新问题了,爬去的内容是乱码,而源码是正常的,这不是怪了嘛,想想肯定是页面没用utf-8

把utf-8 加上之后,问题完美解决

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题

时间: 2024-10-12 22:53:13

Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题的相关文章

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence

UnicodeEncodeError Traceback (most recent call last) <ipython-input-95-45a7accf2da0> in <module> 1 fout = open('job_desc.txt', 'wt') 2 for info in job_desc: ----> 3 fout.write("{},\"{}\"\n".format(info[0],info[1].replace

20170427报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position

今天写python,将网上数据流编写进文件里时遇到的,网上搜到结果并正确的进行了处理,把原文解决方法拷过来了,嘿嘿 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position - 这个问题. 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的.

UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 46:illegal multibyte sequence

最近使用python写入文件时,出现了如下的错误: 但是content的内容是unicode编码,不知道怎么和gbk扯上了关系,对content使用encode()和decode(),用gbk,utf-8,gb2312各种编码解码都没有效果: 在网上查找资料,看到一篇文章关于这个的说法:http://blog.csdn.net/xiaoyi_zhang/article/details/51675099 结论是: 1.'gbk' codec can't encode character :说明是将

UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 1987: illegal multibyte sequence

在爬取 url = "http://stats.meizhou.gov.cn/show/index/1543/1689" 时出现了问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1987: illegal multibyte sequence 解决方案: (待解决) UnicodeEncodeError: 'gbk' codec can't encode character '\

【编码】UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position XXX

有时候在win中运行代码会遇到题目中的报错问题: "UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX",让人摸不着头脑的是程序开头的编码设置# coding:utf-8 和数据流IO操作时的编码转化都已经在程序中加入加入了.gbk哪里来的呢?其实就是win中新文件的默认编码是gbk. 当我们遇到编码问题的时候,有三个地方需要注意的:文件的编码,IDE的编码,还有数据流IO操作过程中

[python3 - TroubleShooting] UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 27: illegal multibyte sequence

问题: cmd里直接print的时候报错 之前已经测试了一个页面,编码没有问题.这是在爬类似页面的时候报的错 思路: 因为这个看上去不是整体的编码问题,所以我直接查看了报错的字符编码'\xa0',发现这个是unicode下的'&nbps',而这个编码不存在于gbk里 尝试: replace(u'\xa0', u' ') - 报同一个错,不知道为什么... encode('gbk', 'ignore').decode('gbk') - 解决 [python3 - TroubleShooting]

day1 UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character &#39;\xa0&#39; in position 2490: illegal multibyte sequence 错误提示

get方式得到网页的信息 #coding=utf-8 #pip install requests #直接get到网页的信息 import requests from bs4 import BeautifulSoup response = requests.get('https://www.sogou.com/web?query=搞基建') print(response.text) #打印搜索出来的全部信息 #从 response.text 找出 <div class = 'wrwrap> &l

【python】Python3中出现&#39;gbk&#39; codec can&#39;t encode characte的成功解决方法?

亲身测试,所遇问题完全解决!2018/07/08 21:37 环境:windows,Pycharm,python3.6.2 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题. 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗

Python读取中文txt文件错误:UnicodeEncodeError: &#39;gbk&#39; codec can&#39;t encode character

1 with open(file,'r') as f: 2 line=f.readline() 3 i=1 4 while line: 5 line=line.decode('utf-8') 6 print str(i)+": "+line7 line=f.readline() 8 i=i+1 用以上代码读取一个包含中文的txt文件时,在正确地读取并打印了六百多行之后,print str(i)+": "+line这一行报错: UnicodeEncodeError: