Map2Shp软件字符编码解决方案——彻底杜绝Shape格式乱码

在使用Shape文件时,如果里面有中文属性信息时,经常会遇到属性信息变为乱码。尤其是ArcGIS10.2.1之后,Esri改变了软件的默认字符编码规则,打开之前保存的Shapefile文件,总会不时遇到中文字符出现乱码现象。对此问题,网上好多建议是修改系统注册表或全局的字符编码设置,这样做固然有效,但这样会引起打开其它种类字符编码数据显示乱码的的问题;另外当我们拿到一个显示乱码的Shape数据,我们也很难猜出它本身是什么字符集的数据,使得乱码问题成为一个极其困扰的问题。

为此,Map2Shp软件提供了专门的解决方案。转换结果输出时,可以选择Shape文件的字符编码(如图)。其中,ArcMap10.2及以前版本,中文字符默认采用ANSI编码,与操作系统默认编码格式一致,多为GBK编码方式,不会出现中文乱码,具有较广的通用性。ArcGIS10.2.1及之后版本,中文字符默认采用UTF-8编码,ArcGIS会先读取DBF头文件LDID中的编码,然后是cpg文件,最后是CodePage。Map2Shp输出UTF-8编码文件时,转换结果文件中增加一个.cpg文件,文件里面定义了dbf所使用的编码格式为UTF-8,ArcMap会读取.cpg文件来判断文件的编码,打开就不会有乱码。

总体上来说,Shape文件中文出现乱码的根本原因是读取文件使用的编码类型和文件实际存储的编码类型不一致所致,Map2Shp提供的解决方案中确保了编码信息的一致性,无论选用何种编码方式,在ArcGIS不同版本下均能够正确识别,彻底解决了中文乱码问题。

此外,由于shape文件自身限制,属性字段名称长度不能超过9个字节,而UTF-8 编码下单个汉字至少需要3个字节存储,因此UTF-8 编码下shape文件字段名称会被截断为最长3个汉字,而存在字段名称截断丢失现象。

原文地址:https://www.cnblogs.com/map2shp/p/11018829.html

时间: 2024-08-30 15:54:37

Map2Shp软件字符编码解决方案——彻底杜绝Shape格式乱码的相关文章

springmvc字符编码过滤器对于中文get请求乱码问题的解决方法

<filter> <filter-name>encodingFilter</filter-name> <filter-class> org.springframework.web.filter.CharacterEncodingFilter </filter-class> <init-param> <param-name>encoding</param-name> <param-value>utf-

C#编程总结(九)字符编码

C#编程总结(九)字符编码 相信大家一定遇到过乱码的问题,为什么会乱码呢?输出的数据怎么就跟输入的不一样呢? 最近在总结加密问题,也遇到了同样的困扰.所以今天来集中解决这个问题. 什么是字符? 字符是指计算机中使用的字母.数字.字和符号,包括:1.2.3.A.B.C.~!·#¥%……—*()——+等等. 字符集(Charset) 字符集(Charset)是一个系统支持的所有抽象字符的集合. 字符是各种文字和符号的总称,包括各国家文字.标点符号.图形符号.数字等. 什么是字符编码? 字符编码(Ch

Python自动化开发课堂笔记【Day03】 - Python基础(字符编码使用,文件处理,函数)

字符编码使用 1. 文本编辑器如何存取文件 文本编辑器相当一个运行在内存中的进程,所以文件内容在编辑未存储时都是在内存中的,尚未存储在硬盘之中,在没有保存之前,所编辑的任何文本都只是一堆字符,没有任何逻辑上的意义,当存储文件的时候需要以一定的编码格式存储于硬盘之中,当进行文件读取的时候也需要以同样的编码格式进行读取到内存之中进行操作,如果存储文件的编码和读取文件的编码不一致则会引起读取过程中的乱码导致文件操作失败. P.S. --> Python解释器执行py文件的原理. Step1. Pyth

Java web应用中的常见字符编码问题的解决方法

以下是 Java Web应用的常见编码问题 1. html页面的编码 在web应用中,通常浏览器会根据http header: Content-type的值来决定用什么encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 页面使用的就UTF-8编码. 但是考虑到离线的html(用户可能把页面html保存到本地), 打开离线的html的时候就要在meta指定编码,当然不指定也会有default值,那么不指定有时就可能出现乱码. Meta标签 <

python基础之字符编码及文件操作

一.了解字符编码前的知识储备 1.计算机运行程序或读取文件的原理 为了使计算机运行速度不被I/O操作速度拖慢,CPU并不会直接从硬盘中读取数据,因为硬盘的读写速度和CPU相差太大,所以CPU都是从速度相对较快的内存中读取数据的.而程序文件和文本文件为了永久保存又都保存在硬盘中,因此计算机运行程序或读取文件的过程一般是这样的,先由操作系统控制硬盘将程序文件或文本文件读取到内存中,然后CPU再从内存中读取数据运行或者输出到终端打印到屏幕上. 2.文本编辑器读取文件原理 2.1文本编辑器程序文件读取到

字符编码笔记:ASCII,Unicode和UTF-8

很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为"计算机". 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约

Python2.7字符编码详解

一. 字符编码基础 为明确概念,将字符集的编码模型分为以下4个层次: 抽象字符清单(Abstract Character Repertoire, ACR):待编码文字和符号的无序集合,包括各国文字.标点.图形符号.数字等. 已编码字符集(Coded Character Set, CCS):从抽象字符清单到非负整数码点(code point)集合的映射. 字符编码格式(Character Encoding Form, CEF):从码点集合到指定宽度(如32比特整数)编码单元(code unit)的

计算机字符编码详尽讲解

from http://www.guokr.com/blog/763017/ http://blog.csdn.net/stilling2006/article/details/4129700 下载一个文档,一打开发现是乱码,不抓狂才怪…… 你们都知道,这都是字符编码闯的祸.ASCII.ANSI.GB18030.Unicode.UTF-8.UTF-8 with BOM.UTF without BOM.UTF-16.UTF-16LE.UTF-16BE…… 一大坨的谁分得清?听说UTF-8就是Uni

对字符编码的理解

1.含义 关于人类文明中的语言符号与计算机所认识的0和1之间的一个对应关系表.字符-------通过翻译----------计算机认识的数字.这个过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之为字符编码.同一编码规范的不同版本间具有向下兼容性. 2.发展历史 (1)阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCIIASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256