Pandas读取csv文件报错UnicodeDecodeError

1、问题描述：

在使用pandas的read_csv的时候，报错，如下，UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 254: unexpected end of data。

经过分析，可能是utf-8不识别该字符，经过各种尝试，找到解决方法。

2、解决办法

找到报错的csv文件，以记事本形式打开

打开后文件，另存为，将文件编码格式由ANSI改为UTF-8，文件类型存为csv这里有一个编码格式。

3、执行pd.read_csv

原文地址：https://www.cnblogs.com/Iceredtea/p/12181427.html

时间： 2024-10-29 16:09:31

Pandas读取csv文件报错UnicodeDecodeError的相关文章

[解决问题] pandas读取csv文件报错OSError解决方案

python用padans.csv_read函数出现OSError: Initializing from file failed 问题:文件路径中存在中文解决办法:修改文件路径名为全英文包括文件名原文地址:https://www.cnblogs.com/liu66blog/p/8494997.html

Python读取log文件报错“UnicodeDecodeError”

问题描述: 写了一个读取log文件的Python脚本: # -*- coding:utf-8 -*- import os import numpy as np file = 'D:\pythonfile\test.log' for line in open("test.log","r"): print(line) 但是在执行时报错:执行代码报错: Traceback (most recent call last): File "D:/pythonfile/

Python读取txt文件报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0

Python使用open读取txt中文内容的文件时,有可能会报错,报错内容如下:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0. 这里举一个例子:txt=open("threekingdoms.txt","r",encoding="utf-8").read(),在运行时就会报错. 要处理这个问题有两个办法,如下: 第一个办法,将编码方式由utf-8改为g

.net 读取Excel文件报错

错误内容 Microsoft Office Excel 不能访问文件“D:\WWWRoot\Website\Test\Excels\Test1.xls”. 可能的原因有: 1 文件名称或路径不存在. 2 文件正被其他程序使用. 3 您正要保存的工作簿与当前打开的工作簿同名. 解决办法: 1 1).通过webconfig中增加模拟,加入管理员权限, <identity impersonate="true" userName="系统管理员" password=&q

读取TFRecord文件报错

读取保存有多个样例的TFRecord文件时报错: InvalidArgumentError (see above for traceback): Input to reshape is a tensor with 14410143 values, but the requested shape has 230400 [[Node: Reshape = Reshape[T=DT_UINT8, Tshape=DT_INT32, _device="/job:localhost/replica:0/ta

读取xml文件报错：Invalid byte 2 of 2-byte UTF-8 sequence。

程序读取xml文件后,系统报“Invalid byte 2 of 2-byte UTF-8 sequence”错误,如何解决呢? 1.程序解析xml的时候,出现Invalid byte 2 of 2-byte UTF-8 sequence的错误 2.应该是编码出现错误,一般用UE,editplus等工具打开文件.修改完成文件后,保存为UTF-8格式就可以了:或者用UltraEdit打开该xml ,一次文件-->转换-->ASCII到UTF-8, 再保存,即可. 3.也有可能是文件少了头文件定

python读取xml文件报错ValueError: multi-byte encodings are not supported

1.在使用python对xml文件进行读取时,提示ValueError: multi-byte encodings are not supported 很多贴子上说把xml的编码格式改为,就可以正常执行了 <?xml version="1.0" encoding="utf-8"?> 但是事实证明,不成功,解决方法 1.用记事本方式打开xml文件,encoding后面指的就是编码方式 2.把你的xml文件另外为utf-8 在进行读取,文件编码问题解决原文

python-pandas读取mongodb、读取csv文件

续上一篇博客(‘’selenium爬取NBA并将数据存储到MongoDB‘)https://www.cnblogs.com/lutt/p/10810581.html 本篇的内容是将存储到mongo的数据用pandas读取出来,存到CSV文件,然后pandas读取CSV文件. 其中mongo的操作涉及到授权的问题: 如果遇到报错关于authenticate的,需要加授权,用时需要将各参数换成自己的 #导入相应的包 import pymongo import pandas as pd from pa

Python读取CSV文件，报错：UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence

Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence 解决办法: 在语句open(sFileName,newline='')中,增加encoding='UTF-8',如下: open(sFileName,newline='',encoding='UTF-8') Python读取CSV文件,报错:UnicodeDecode