[字符编码]Invalid byte 1 of 1-byte UTF-8 sequence终极解决方案

今天在eclipse中编写pom.xml文件时，注释中的中文被eclipse识别到错误：Invalid byte 1 of 1-byte UTF-8 sequence，曾多次遇到该问题，问题的根源是：

The cause of this is a file that is not UTF-8 is being parsed as UTF-8. It is likely that the parser is encountering a byte value in the range FE-FF. These values are invalid in the UTF-8 encoding.

但这次很诡异，我使用notepad++将pom.xml的编码保存为“UTF-8无BOM”形式，pom.xml文件内的encoding属性设置为“UTF-8”，问题依旧啊，郁闷了，难道上述的理论有问题？还是eclipse的bug呢？在网上看了半天，基本都是这么说的。

第一，可以直接在XML文件中更改UTF-8为GBK或GB2312

<?xml version="1.0" encoding="GB2312"?>

第二，可以在Eclipse中更改，在 eclipse 的功能表 [Project]→[Properties]，點選 [Resources]，在右邊的「Text file encoding」，把原來是系統預設的編碼，改為「UTF-8」。

第一种方案可行，属于逃避的方法，放弃！第二种也不是解决我这种问题的，继续网上搜索惊奇的发现，原来解决方案是这样的：

把xml的encoding属性值UTF-8改为UTF8，我操，太伤蛋了

时间： 2024-12-09 19:06:20

[字符编码]Invalid byte 1 of 1-byte UTF-8 sequence终极解决方案的相关文章

xml中1字节的UTF-8序列的字节1无效（[字符编码]Invalid byte 1 of 1-by

今天在eclipse中编写pom.xml文件时,注释中的中文被eclipse识别到错误:Invalid byte 1 of 1-byte UTF-8 sequence,曾多次遇到该问题,问题的根源是: The cause of this is a file that is not UTF-8 is being parsed as UTF-8. It is likely that the parser is encountering a byte value in the range FE-FF.

xml中1字节的UTF-8序列的字节1无效（[字符编码]Invalid byte 1 of 1-byte UTF-8 sequence终极解决方案）

字符编码转换笔记

何为字符编码? 字符编码为计算机文字的存储格式, 例如英文字母以ASCII编码存储, 即单字节存储, 其他字符编码有 UTF-8(通用字符编码格式), 其他区域性编码格式, 例如 ISO-8859(西欧), windows-1251俄文,中文GB编码. 为什么需要转换? 正因各个地区有不同的编码格式, 为了交换信息的目的, 就需要将相同字符的从一种编码格式转换为另外一种编码格式. 通用的编码格式为 UTF-8, 其囊括了世界上所有字符, 所以一般为了通用性, 文件都以UTF-8编

字符集与字符编码的强化理解与操作实践

字符集与字符编码的强化理解与操作实践踩坑最近在工作中遇到了一个说大不大说小不小的问题,就是当我解析一个xml文件的时候,抛出了一个"Invalid byte 2 of 2-byte UTF-8 sequence"的异常,这个异常会导致解析直接退出,显然不能容忍.查阅相关资料稍微定位了一下,大概知道是字符集的问题,仔细一看,xml文件中的确有中文字符,而且当我把这些中文字符删了之后的确又能解析成功.不过我还是不能理解这当中的缘由,不过由于时间原因,当时只是把中文字符删了就草草完工.现

python 字符编码练习

通过下面的练习,加深对python字符编码的认识 # \x00 - \xff 256个字符 >>> a = range(256)>>> b = bytes(a) # 不用参数encoding >>> b b'\x00\x01\x02 ... \xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff' >>> b.decode('utf-8') # 报错 Traceback (most recent call l

5.字符编码梳理

字符编码:字符编码的种类和进化流程在哪里需要字符编码的转换?输入保存至计算机流程解释器读写python文件流程python默认的编码两种python的数据类型以及对应的存入数据小结:python 中的unicode的正确用法python编码中最常见的两个错误encode和decodeunicode error实验encode error实验decode error实验实践中的注意事项: 字符编码: 字符编码(英语:Character encoding).字集码是把字符集中的字符编码为指定集合中某

unicode与字符编码

1. 概述 unicode 码又称为"万国码",顾名思义,世界上所有语言对应的字符都可以在 unicode 码表中找到对应的编号.而我们常说的 utf-8,utf-16, utf-32 等则是编码方式,是将码表中的编码转化成计算机字节的方法. unicode 是一种码表,像这样的还有 US-ASCII,GBK,UCS-2,UCS-4 等.许多人搞不清楚 unicode 和 utf-16 之间的区别,将他们混为一谈.这里做个简单澄清,希望对字符编码"小白"有些帮助.

.NET Framework 中的字符编码

字符是可用多种不同方式表示的抽象实体. 字符编码是一种为受支持字符集中的每个字符进行配对的系统,配对时使用的是表示该字符的某些值. 例如,摩尔斯电码是一种为罗马字母表中的每个字符进行配对的字符编码,配对时使用的是适合在电报线路中传输的点和线模式. 计算机的字符编码将所支持字符集中的每个字符与代表该字符的数值进行配对.字符编码具有两个不同的组件: 编码器,将字符序列转换为数值序列(字节). 解码器,将字节序列转换为字符序列. 字符编码描述了编码器和解码器的操作规则. 例如,UTF8Encoding

Python学习笔记1（变量，字符编码）

跟着老男孩教育Alex的视频学习Python,写博客记录自己的学习过程,记录所讲授的知识点. 此篇微博直接从学习一个程序的仪式感"Hello word"开始写起,例如Python的介绍.发展史.Python2和3的区别.安装.优缺点等,将不会在此记录. 这是我第一次编写博客,不管是内容总结还是外观形式都肯定会有所欠缺.不过这博客主要是给自己记录学习过程的,如果想自学的话,在此推荐给你Alex金角大王和Eric银角大王的微博. 金角大王传送门:http://www.cnblogs.com