python运行显示编码错误

python中运行显示编码错误一般有2种原因:

编码与译码的方式不一致

在编写Python时,当使用中文输出或注释时运行脚本,会提示错误信息:

SyntaxError: Non-ASCII character ‘\xe5‘ in file *******

【原因】

python解释器的默认编码文件是用的ASCII码,而你的python文件中使用了中文等非英语字符。

【解决办法】

在Python源文件的最开始一行,加入一句:

# coding=UTF-8(等号换为”:“也可以)

注意:等号左右两边没有空格

补充:

.py文件的编码方式由编辑器决定,而在中文环境下,编辑器的编码方式一般是utf-8,python解释器在译码时,译码方式为要与源文件的编码方式一致。

具体可参考官方文档:https://www.python.org/dev/peps/pep-0263/

存在部分字符无法译码的情况

编码与译码的方式是一致的,但是部分字符无法译码。

读取中文txt文件时,经常会出现: ‘gbk‘ codec can‘t decode bytes in position 31023: illegal multibyte sequence

这种情况就是文本里含有gbk编码方式中没有的字符

最好的解决办法:

使用gb18030编码方式,因为gb18030编码方式包含gbk,支持的字符数更多,并且加入‘ignore‘忽略无法读取的字符。

例如;

open(‘../hlp_stop_words.txt‘, encoding=‘gb18030‘, errors=‘ignore‘)

原文地址:https://www.cnblogs.com/mlgjb/p/9761326.html

时间: 2024-11-10 16:17:06

python运行显示编码错误的相关文章

Python文件读取编码错误问题解决之(PyCharm开发工具默认设置的坑。。。)

刚接触Python学习,正准备做个爬虫的例子,谁知道代码一开始就遇到了一个大坑,狂汗啊. 问题是这样的:我通过代码爬取了博客园首页的HTML代码并存入到blog.txt文件当中,然后准备读取出来之后进行分析,可就在读取文件的这一步出现了问题. 执行读取代码的时候程序总是会抛一个叫 “UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 117274: illegal multibyte sequence

Python 读取文本文件编码错误解决方案(未知文本文件编码情况下解决方案)

很多情况下我们是这样读取文本文件的: with open(r'F:\.Python Project\spidertest1\test\pdd凉席.txt', 'r') as f: text = f.read()但是如果该文本文件是gbk格式的,那么将会报以下错误: Traceback (most recent call last): File "F:/.Python Project/spidertest1/test/MyTest4.py", line 14, in <module

Python脚本运行出现语法错误:IndentationError: unindent does not match any outer indentation level

[问题] 一个python脚本,本来都运行好好的,然后写了几行代码,而且也都确保每行都对齐了,但是运行的时候,却出现语法错误: IndentationError: unindent does not match any outer indentation level [解决过程] 1.对于此错误,最常见的原因是,的确没有对齐.但是我根据错误提示的行数,去代码中看了下,没啥问题啊. 都是用TAB键,对齐好了的,没有不对齐的行数啊. 2.以为是前面的注释的内容影响后面的语句的语法了,所以把前面的注释

python编码错误的解决办法 SyntaxError: Non-ASCII character &#39;\xe5&#39; in file

[提出问题]. 在编写Python时,当使用中文输出或注释时运行脚本,会提示错误信息: SyntaxError: Non-ASCII character '\xe5' in file ******* ---------------------------------------------------------------------------------------------------------- [分析问题]. -----------------------------------

Python编码错误的解决办法SyntaxError: Non-ASCII character &#39;\xe5&#39; in file

[现象] 在编写Python时,当使用中文输出或注释时运行脚本,会提示错误信息: SyntaxError: Non-ASCII character '\xe5' in file ******* [原因] python的默认编码文件是用的ASCII码,而你的python文件中使用了中文等非英语字符. [解决办法] 在Python源文件的最开始一行,加入一句: # coding=UTF-8(等号换为”:“也可以) 或者 # -*- coding:UTF-8 -*- 转自[http://blog.cs

python 运行时报错误SyntaxError: Non-ASCII character &#39;\xe5&#39; in file 1.py on line 2

File "1.py", line 2SyntaxError: Non-ASCII character '\xe5' in file 1.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 原因是:Python默认是以ASCII作为编码方式的,需要在文件开头设置一下编码 # -*- coding: UTF-8 -*- 或者 #coding=utf

python编码错误

错误: [错误分析]第二个参数必须为类,否则会报TypeError,所以正确的应该是这样的: 但如果第二个参数是类型对象,则不会报上面的错误,是允许的,比如说: +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 错误: [错误分析]这个涉及到调用顺序问题,即解析方法的MRO调用顺序,在Python2.7版本之后,这样调用会报错, 必须是子类先放前面,然后才是父类.如下所示,方不会报错. ++++++++++++++++++++

Python文件写入编码问题

今天,用Python写文件,发现中国人真不容易,任何编程问题都需要比老外多学一套应对编码的方法.JSP写完了吗?中文编码问题考虑一下:servlet中的url,转发的文本,都有可能与什么gb2312,isoxxxx,utf-8,unicode,ascii扯上关系.以至于,我们每每遇到运行异常,都会"一朝被蛇咬十年怕井绳"般思考"是不是又是编码导致的". 在python里,编码问题依然是个恶心的问题.之前在VS for Python的IDE环境下,已经饱尝中文编码之苦

在线 Python运行工具

摘要 准备 PHP环境设置 原理 system方式 exec 方式 源码 核心 完整代码 indexphp callpyphp temppy 演示 首页 提示信息 简要测试 运行等待 高级测试 错误提示 总结 摘要 昨天心血来潮,做了一个在线的PHP编辑工具 http://blog.csdn.net/marksinoberg/article/details/53869637 ,可以方便的练习PHP的基本语法,以及数据库的操作.结尾说可能会做一个Python版的在线编辑工具,那么说到做到.今天就写