mac中txt文件打不开—— 文本编码“简体中文(mac os)”不适用 (转载)

在苹果机上读取txt文件时,有的会打不开,

出现提示: 文本编码“简体中文(mac os)”不适用。该文件可能已使用了不同的文本编码来存储,或者可能不是文本文件。这是由于文件不同编码造成的。

在mac上面有2种中文编码:

一种是:和windows一样的中文(GB 18030)

一种是:简体中文(Mac OS)

两种编码不一样

 

解决办法:

打开文本编辑—偏好设置——打开和存储——纯文本文件编码——打开文件——选择“中文(GB 18030)” 

附:

国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。

GB18030主要有以下特点:

  • 与UTF-8相同,采用多字节编码,每个字可以由1个、2个或4个字节组成。
  • 编码空间庞大,最多可定义161万个字符。
  • 支持中国国内少数民族的文字,不需要动用造字区。
  • 汉字收录范围包含繁体汉字以及日韩汉字

目前,GB18030有两个版本:GB18030-2000和GB18030-2005。GB18030-2005是最新版本。

GB18030-2000是GBK的取代版本,它的主要特点是在GBK基础上增加了CJK统一汉字扩充A的汉字。

GB18030-2000编码标准是由信息产业部和国家质量技术监督局在2000年 3月17日联合发布的,并且将作为一项国家标准在2001年的1月正式强制执行。

GB18030-2005的主要特点是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。

GB18030-2005《信息技术中文编码字符集》是我国自主研制的以汉字为主并包含多种我国少数民族文字(如藏、蒙古、傣、彝、朝鲜、维吾尔文等)的超大型中文编码字符集强制性标准,其中收入汉字70000余个。

GB18030-2005与GB18030-2000的编码体系结构是完全相同的。

2000年发布的GB18030-2000,全名是《信息技术 汉字编码字符集 基本集的扩充》。GB18030-2000仅规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码。

GB18030-2000是全文强制性标准,市场上销售的产品必须符合。 

2005年发布的GB18030-2005在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码,增加的这些内容是推荐性的。

GB18030-2005为部分强制性标准,自发布之日起代替GB18030-2000。

GB18030,最新版本为GB18030-2005,其全称为中华人民共和国国家标准GB 18030-2005《信息技术 中文编码字符集》,是中华人民共和国现时最新的内码字集,是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》的修订版。与GB2312-1980完全兼容,与GBK基本兼容,支持GB 13000Unicode的全部统一汉字,共收录汉字70244个。

GB18030标准的初版是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》,它是由中华人民共和国信息产业部电子工业标准化研究所、北京大学计算机技术研究所、北大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司、中科院软件所、长城软件公司、四通利方公司、中软总公司、金山软件公司、联想公司起草,由国家质量技术监督局于2000年3月17日发布。

GB 18030标准从生效之日期起,同时代替原国家技术监督局标准化司和原电子工业部科技与质量监督司联合以技监标函1995229号文发布和实施的技术规范指导性文件《汉字内码扩展规范(GBK)》1.0版。

现行版本GB 18030-2005《信息技术 中文编码字符集》为GB 18030标准的第一次修订版,由国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施。本标准的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即0x8139EE39--0x82358738)部分为强制性。本标准代替GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》。

GB 18030-2000,兼容 Unicode 3.0 中日韩统一表意文字,共收27533个汉字;2000年3月17日发布

GB 18030-2005,更新至 Unicode 4.1 中日韩统一表意文字及增加少数民族文字,共有70244个汉字;2005年11月8日发布、2006年5月1日实施

GB 18030与Unicode的关系

GB 18030是一种对字符集的多字节编码格式,相当于UTF-8(对Unicode码点(code point)的编码传输格式),而且都是向后兼容ASCII,并且能表示所有的Unicode码点。GB 18030的四字节编码共有1,587,600 (126×10×126×10), 足以覆盖Unicode的1,111,998 (17×65536 ? 2048 surrogates ? 66 noncharacters)码点。此外,GB18030还向后兼容了GB 2312GBK编码。与Unicode码点的映射关系(mapping)一部分要查表,其它可以通过算法求出,这与UTF-8相比不够方便。

时间: 2024-10-24 14:52:19

mac中txt文件打不开—— 文本编码“简体中文(mac os)”不适用 (转载)的相关文章

matlab 中txt文件(含字符及数值)处理

matlab 中txt文件(含字符及数值)处理 (2008-08-02 09:45:12) 转载▼ 标签: 杂谈 分类: matlab及C学习 Matlab文件操作及读txt文件ZZ 2008-07-11 16:43 matlab文件操作文件操作是一种重要的输入输出方式,即从数据文件读取数据或将结果写入数据文件.MATLAB提供了一系列低层输入输出函数,专门用于文件操作.1.文件的打开与关闭1)打开文件在读写文件之前,必须先用fopen函数打开或创建文件,并指定对该文件进行的操作方式.fopen

多个txt文件合并成一个文本

如何将多个txt文件合并成一个文本 (1)将多个txt文件放在一个文件夹下. (2)编写一个批处理文件,里面的命令为type *.txt >a.txt (3)执行该批处理文件,则所有txt文件合并到a.txt文件中了. 原文地址:https://www.cnblogs.com/apromise/p/10847009.html

win8系统中chm文件打不开怎么办

chm是一种常见的帮助文件,正常情况下,双击chm文件就能直接打开了,不过最近有Win8系统用户反映chm文件打不开,用户不知道这是怎么回事,也不知道该怎么办,为此非常苦恼.好系统重装助手来告诉你Win8系统chm文件打不开要怎么办呢? 1.打开chm文件时,会弹出来一个安全警告窗口,我们需要点击"打开"按钮: 2.打开之后会发现,点任何选项,右边框中都是空白: 3.这个时候需要我们关闭文件,然后找到文件,右键属性: 4.在常规栏中找到下面的"安全"项,点击&quo

7.6 提取text.txt文件内容,进行文本等号以后求和

1 //提取text.txt文件内容,进行文本等号以后求和 2 #include <stdio.h> 3 #include <stdlib.h> 4 #define F_PRINT_ERR(e) 5 do 6 { 7 if(e == NULL) 8 { 9 printf("open error");10 exit(-1);11 }12 }13 while(0) 14 int main(void) 15 { 16 17 FILE* pf = fopen("

ubuntu gedit 打开 windows 分区中txt 文件乱码

http://blog.csdn.net/pipisorry/article/details/39482861 ubuntu 12.04 gedit 打开 windows 分区中的txt 文件乱码,是因为 ubuntu 和 windows 两个系统的编码不同. 解决办法1:(推荐) 终端里依次输入以下 2 条命令即可: gsettings setorg.gnome.gedit.preferences.encodings auto-detected "['GB18030','GB2312', 'G

android中的文件操作详解以及内部存储和外部存储(转载)

原文链接:http://m.blog.csdn.net/article/details?id=17725989 摘要 其实安卓文件的操作和java在pc环境下的操作并无二致,之所以需要单独讲解是因为安卓系统提供了不同于pc的访问文件系统根路径的api,同时对一个应用的私有文件做了统一的管理.根据我的经验,初学者在这部分感到很容易混淆内部存储和外部存储两个概念. 相对 其实安卓文件的操作和java在pc环境下的操作并无二致,之所以需要单独讲解是因为安卓系统提供了不同于pc的访问文件系统根路径的ap

iOS中读取文件夹下所有文本的行数

#import <Foundation/Foundation.h> int codeLineCount(NSString *path) { //1.获得文件管理者 NSFileManager *mgr = [NSFileManager defaultManager]; //判断path是文件夹还是文件路径 BOOL dir = NO; // 标记是否为文件夹 //这个路径是否存在 BOOL exist = [mgr fileExistsAtPath:path isDirectory:&

上传txt文件编码格式判断(文本乱码解决方法)

说明 通过ajax或者浏览上传文本文件,上传时候c#处理时候因为文本格式的创建不同,在获取内容时候会出现中文乱码. 解决方法 通过上传的文件流,判断文件的编码格式,在使用对应的编码格式获取文本内容 #region 通过给定的文件流,判断文件的编码类型        /// <summary>        /// 通过给定的文件流,判断文件的编码类型        /// </summary>        /// <param name=“fs“>文件流</pa

解决ubuntu打开windows中txt文件出现乱码现象

1.下载 dconf-editor工具 打开终端,输入 (1)sudo apt-get install dconf-tools (2)dconf-editor (3)依次打开   org->gnome->gedit->preferences->encodings 在'UTF-8'前添加'GBK' 注:'GB18030','GB2312'也可以