各个国家所对应的字符集列表

字符集 标签 别名
阿拉伯语 (ASMO 708) ASMO-708  
阿拉伯语 (DOS) DOS-720  
阿拉伯语 (ISO) iso-8859-6 arabic, csISOLatinArabic, ECMA-114, ISO_8859-6, ISO_8859-6:1987, iso-ir-127
阿拉伯语 (Mac) x-mac-arabic  
阿拉伯语 (Windows) windows-1256 cp1256
波罗的语 (DOS) ibm775 CP500
波罗的语 (ISO) iso-8859-4 csISOLatin4, ISO_8859-4, ISO_8859-4:1988, iso-ir-110, l4, latin4
波罗的语 (Windows) windows-1257  
中欧字符 (DOS) ibm852 cp852
中欧字符 (ISO) iso-8859-2 csISOLatin2, iso_8859-2, iso_8859-2:1987, iso8859-2, iso-ir-101, l2, latin2
中欧字符 (Mac) x-mac-ce  
中欧字符 (Windows) windows-1250 x-cp1250
中国国家标准 gb18030  
简体中文 (EUC) EUC-CN x-euc-cn
简体中文 (GB2312) gb2312 chinese, CN-GB, csGB2312, csGB231280, csISO58GB231280, GB_2312-80, GB231280, GB2312-80, GBK, iso-ir-58
简体中文 (GB18030) gb18030  
简体中文 (HZ) hz-gb-2312  
简体中文 (Mac) x-mac-chinesesimp  
繁体中文 (Big5) big5 cn-big5, csbig5, x-x-big5
繁体中文 (CNS) x-Chinese-CNS  
繁体中文 (Eten) x-Chinese-Eten  
繁体中文 (Mac) x-mac-chinesetrad  
西里尔语 (DOS) cp866 ibm866
西里尔语 (ISO) iso-8859-5 csISOLatin5, csISOLatinCyrillic, cyrillic, ISO_8859-5, ISO_8859-5:1988, iso-ir-144, l5
西里尔语 (KOI8-R) koi8-r csKOI8R, koi, koi8, koi8r
西里尔语 (KOI8-U) koi8-u koi8-ru
西里尔语 (Mac) x-mac-cyrillic  
西里尔语 (Windows) windows-1251 x-cp1251
欧罗巴语 x-Europa  
德语 (IA5) x-IA5-German  
希腊语 (DOS) ibm737  
希腊语 (ISO) iso-8859-7 csISOLatinGreek, ECMA-118, ELOT_928, greek, greek8, ISO_8859-7, ISO_8859-7:1987, iso-ir-126
希腊语 (Mac) x-mac-greek  
希腊语 (Windows) windows-1253  
现代希腊语 (DOS) ibm869  
希伯来语 (DOS) DOS-862  
希伯来语 (ISO-Logical) iso-8859-8-i logical
希伯来语 (ISO-Visual) iso-8859-8 csISOLatinHebrew, hebrew, ISO_8859-8, ISO_8859-8:1988, ISO-8859-8, iso-ir-138, visual
希伯来语 (Mac) x-mac-hebrew  
希伯来语 (Windows) windows-1255 ISO_8859-8-I, ISO-8859-8, visual
IBM EBCDIC (阿拉伯语) x-EBCDIC-Arabic  
IBM EBCDIC (西里尔文俄语) x-EBCDIC-CyrillicRussian  
IBM EBCDIC (西里尔文塞尔维亚语-保加利亚语) x-EBCDIC-CyrillicSerbianBulgarian  
IBM EBCDIC (丹麦-挪威) x-EBCDIC-DenmarkNorway  
IBM EBCDIC (丹麦-挪威-欧洲) x-ebcdic-denmarknorway-euro  
IBM EBCDIC (芬兰-瑞典) x-EBCDIC-FinlandSweden  
IBM EBCDIC (芬兰-瑞士-欧洲) x-ebcdic-finlandsweden-euro  
IBM EBCDIC (芬兰-瑞士-欧洲) x-ebcdic-finlandsweden-euro X-EBCDIC-France
IBM EBCDIC (法国-欧洲) x-ebcdic-france-euro  
IBM EBCDIC (德国) x-EBCDIC-Germany  
IBM EBCDIC (德国-欧洲) x-ebcdic-germany-euro  
IBM EBCDIC (现代希腊语) x-EBCDIC-GreekModern  
IBM EBCDIC (希腊语) x-EBCDIC-Greek  
IBM EBCDIC (希伯来语) x-EBCDIC-Hebrew  
IBM EBCDIC (冰岛语) x-EBCDIC-Icelandic  
IBM EBCDIC (冰岛语-欧洲) x-ebcdic-icelandic-euro  
IBM EBCDIC (国际-欧洲) x-ebcdic-international-euro  
IBM EBCDIC (意大利语) x-EBCDIC-Italy  
IBM EBCDIC (意大利-欧洲) x-ebcdic-italy-euro  
IBM EBCDIC (日语和日语片假名) x-EBCDIC-JapaneseAndKana  
IBM EBCDIC (日语和日语-拉丁语) x-EBCDIC-JapaneseAndJapaneseLatin  
IBM EBCDIC (日语和美国-加拿大) x-EBCDIC-JapaneseAndUSCanada  
IBM EBCDIC (日语片假名) x-EBCDIC-JapaneseKatakana  
IBM EBCDIC (朝鲜语和朝鲜语扩展) x-EBCDIC-KoreanAndKoreanExtended  
IBM EBCDIC (朝鲜语扩展) x-EBCDIC-KoreanExtended  
IBM EBCDIC (多语言拉丁语-2) CP870  
IBM EBCDIC (简体中文) x-EBCDIC-SimplifiedChinese  
IBM EBCDIC (西班牙) X-EBCDIC-Spain  
IBM EBCDIC (西班牙-欧洲) x-ebcdic-spain-euro  
IBM EBCDIC (泰语) x-EBCDIC-Thai  
IBM EBCDIC (繁体中文) x-EBCDIC-TraditionalChinese  
IBM EBCDIC (土耳其拉丁语-5) CP1026  
IBM EBCDIC (土耳其语) x-EBCDIC-Turkish  
IBM EBCDIC (英国) x-EBCDIC-UK  
IBM EBCDIC (英国-欧洲) x-ebcdic-uk-euro  
IBM EBCDIC (美国-加拿大) ebcdic-cp-us  
IBM EBCDIC (美国-加拿大-欧洲) x-ebcdic-cp-us-euro  
冰岛语 (DOS) ibm861  
冰岛语 (Mac) x-mac-icelandic  
ISCII 阿萨姆语 x-iscii-as  
ISCII 孟加拉语 x-iscii-be  
ISCII 梵文 x-iscii-de  
ISCII 古吉拉特语 x-iscii-gu  
ISCII 埃纳德语 x-iscii-ka  
ISCII 马拉雅拉姆语 x-iscii-ma  
ISCII 奥里亚语 x-iscii-or  
ISCII 旁遮普文 x-iscii-pa  
ISCII 泰米尔语 x-iscii-ta  
ISCII 泰卢固语 x-iscii-te  
日语 (EUC) euc-jp csEUCPkdFmtJapanese, Extended_UNIX_Code_Packed_Format_for_Japanese, x-euc, x-euc-jp
日语 (JIS) iso-2022-jp  
日语 (JIS-允许 1 个字节的假名-SO/SI) iso-2022-jp _iso-2022-jp$SIO
日语 (JIS-允许 1 个字节的假名) csISO2022JP _iso-2022-jp
日语 (Mac) x-mac-japanese  
日语 (Shift-JIS) shift_jis csShiftJIS, csWindows31J, ms_Kanji, shift-jis, x-ms-cp932, x-sjis
韩语 ks_c_5601-1987 csKSC56011987, euc-kr, iso-ir-149, korean, ks_c_5601, ks_c_5601_1987, ks_c_5601-1989, KSC_5601, KSC5601
朝鲜语 (EUC) euc-kr csEUCKR
朝鲜语 (ISO) iso-2022-kr csISO2022KR
朝鲜语 (Johab) Johab  
朝鲜语 (Mac) x-mac-korean  
Latin 3 (ISO) iso-8859-3 csISO, Latin3, ISO_8859-3, ISO_8859-3:1988, iso-ir-109, l3, latin3
Latin 9 (ISO) iso-8859-15 csISO, Latin9, ISO_8859-15, l9, latin9
挪威语 (IA5) x-IA5-Norwegian  
OEM 美国 IBM437 437, cp437, csPC8, CodePage437
瑞典语 (IA5) x-IA5-Swedish  
泰语 (Windows) windows-874 DOS-874, iso-8859-11, TIS-620
土耳其语 (DOS) ibm857  
土耳其语 (ISO) iso-8859-9 csISO, Latin5, ISO_8859-9, ISO_8859-9:1989, iso-ir-148, l5, latin5
土耳其语 (Mac) x-mac-turkish  
土耳其语 (Windows) windows-1254 ISO_8859-9, ISO_8859-9:1989, iso-8859-9, iso-ir-148, latin5
Unicode unicode utf-16
Unicode (Big-Endian) unicodeFFFE  
Unicode (UTF-7) utf-7 csUnicode11UTF7, unicode-1-1-utf-7, x-unicode-2-0-utf-7
Unicode (UTF-8) utf-8 unicode-1-1-utf-8, unicode-2-0-utf-8, x-unicode-2-0-utf-8
US-ASCII us-ascii ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, csASCII, IBM367, ISO_646.irv:1991, ISO646-US, iso-ir-6us
越南语 (Windows) windows-1258  
西欧语 (DOS) ibm850  
西欧语 (IA5) x-IA5  
西欧语 (ISO) iso-8859-1 cp819, csISO, Latin1, ibm819, iso_8859-1, iso_8859-1:1987, iso8859-1, iso-ir-100, l1, latin1
西欧语 (Mac) macintosh  
西欧语 (Windows) Windows-1252 ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, cp819, csASCII, IBM367, ibm819, ISO_646.irv:1991, iso_8859-1, iso_8859-1:1987, ISO646-US, iso8859-1, iso-8859-1, iso-ir-100, iso-ir-6, latin1, us, us-ascii, x-ansi
时间: 2024-10-13 00:08:26

各个国家所对应的字符集列表的相关文章

oracle18c字符集列表

# Specify the Starter Database character set.## One of the following# AL32UTF8, WE8ISO8859P15, WE8MSWIN1252, EE8ISO8859P2,# EE8MSWIN1250, NE8ISO8859P10, NEE8ISO8859P4, BLT8MSWIN1257,# BLT8ISO8859P13, CL8ISO8859P5, CL8MSWIN1251, AR8ISO8859P6,# AR8MSWI

oracle11g修改字符集的问题

oracle 11g数据库修改字符集 NLS_CHARACTERSET我安装数据库的时候设置为ZHS16GBK,而开发需要的UTF8 据开发反应 改DB的原因是:因为DB不支持中文,向数据库表中插入一条数据的时候,中文就都变了类似于"?(是反问号)"的乱码, 为了能顺利插入成功,故做了此次修改; 查询字符集参数 可以查询以下数据字典或视图查看字符集设置情况 nls_database_parameters.props$.v$nls_parameters 查询结果中NLS_CHARACTE

Oracle出现字符集问题处理方法

1.  Cmd进去DOS 2.  再输入dbca(database  create) 3.  弹出的界面,直接下一步,选择删除数据库 4.  成功删除后,回到一第一界面,选择创建数据库,下一步. 5.  选择:定制数据库(new database),下一步 6.  输入全局数据库名与sid要相同.下一步,一直到第十步. 7.  到第十步有四个选项(内存.调整大小.字符集.连接模式),选择字符集选项卡,选择“从字符集列表中选择”的单选按钮.在里面可以选择自己想要的字符集.

利用Python抓取亚马逊评论列表数据

前段时间,我家妹子公司老板叫她去将法国亚马逊评论列表的前100页共1000个评论用户的联系方式找出来.1000个用户,要一个个的去看再记录下来,而且并不是每个评论用户都会将个人的联系方式留下来.那么问题来了,这样费时费力的工作如果人工去做的话,那么就是花了两天的时间也就找了前30页的数据(还有别的工作要做),然后累的够呛的.本着心疼的原则(程序猿能找到妹子就很不错了,所以得心疼着),就想帮着她做点事. 我本身的工作是做游戏客户端开发的,主要使用的开发语言是lua和c++,并没有接触过网页.网站相

Windows改动cmd字符集

在中文Windows系统中,假设一个文本文件是UTF-8编码的,那么在CMD.exe命令行窗体(所谓的DOS窗体)中不能正确显示文件里的内容.在默认情况下,命令行窗体中使用的代码页是中文或者美国的,即编码是中文字符集或者西文字符集. 假设想正确显示UTF-8字符,能够依照下面步骤操作: 1.打开CMD.exe命令行窗体 2.通过 chcp命令改变代码页,UTF-8的代码页为65001 chcp 65001 运行该操作后.代码页就被变成UTF-8了.可是,在窗体中仍旧不能正确显示UTF-8字符.

Linux - 查看和更改系统字符集

查看当前系统字符集 $ echo $LANG en_US.UTF-8 $ $ env |grep LANG LANG=en_US.UTF-8 $ $ locale |grep CTYPE LC_CTYPE="en_US.UTF-8" $ 更改系统字符集 执行export LANG=<字符集名称>或者export LC_ALL=<字符集名称>命令,可以临时修改系统字符集 执行unset LANG命令可以取消当前系统字符集 执行locale -a命令查看标准字符集列

关于计算机的字符集

1.计算机的字符集有三种 单字节字符集(SBCS).多字节字符集(MBCS).宽字节字符集(Unicode字符集).计算机的每个字符都要使用一个编码表示,每个字符集使用哪一种编码则是由所采用的字符集所决定. 单字节字符集:它的所有字符都只有一个字节的长度.具体实现有:ASCII字符集和扩展ASCII字符集. 多字节字符集:英文和欧洲字符采用一个字节表示,其他国家如中文采用2个字节表示.各个国家有自己的字符集. 操作系统通过代码页给各种字符集定义编号,便于区分. 包含多字节字符集的中文信息软件不能

Oracle数据库多语言文字存储解决方案

一.关于字符集 字符集(也称字元集,Character Set)就是字符编码表(codepage),一个字符不论英文.中文.韩文等在计算机系统内存或硬盘中通过二进制的字节(Byte)保存,这个二进制的编码就是字符编码(也称内码),字符集就是字符与内码的对应(映射)表. 因为多国语言的原因,就出现了根据本国语言制作的字符集.如使用最广泛的ASCII编码,由美国国家标准局(即ANSI)制定,适用于所有拉丁.英文字符.中国大陆使用GB2312,GBK,GB18030等字符集,这些字符集包含所有汉字字符

node.js网页爬虫

使用node开发一个小工具,扫描分子反应动力国家重点实验室新闻动态列表页前三页的信息(地址如下:http://www.sklmr.dicp.ac.cn/list.php?tid=1)要求打印出新闻名称,链接地址,发布时间. 例如在控制台打印 韩克利入选2016年度"中国科学院特聘研究员"计划 2016-06-14     http://www.sklmr.dicp.ac.cn/show.php?id=521 我室金属表面解离吸附动力学理论研究取得新进展    2016-06-12