各个国家所对应的字符集列表

字符集	标签	别名
阿拉伯语 (ASMO 708)	ASMO-708
阿拉伯语 (DOS)	DOS-720
阿拉伯语 (ISO)	iso-8859-6	arabic, csISOLatinArabic, ECMA-114, ISO_8859-6, ISO_8859-6:1987, iso-ir-127
阿拉伯语 (Mac)	x-mac-arabic
阿拉伯语 (Windows)	windows-1256	cp1256
波罗的语 (DOS)	ibm775	CP500
波罗的语 (ISO)	iso-8859-4	csISOLatin4, ISO_8859-4, ISO_8859-4:1988, iso-ir-110, l4, latin4
波罗的语 (Windows)	windows-1257
中欧字符 (DOS)	ibm852	cp852
中欧字符 (ISO)	iso-8859-2	csISOLatin2, iso_8859-2, iso_8859-2:1987, iso8859-2, iso-ir-101, l2, latin2
中欧字符 (Mac)	x-mac-ce
中欧字符 (Windows)	windows-1250	x-cp1250
中国国家标准	gb18030
简体中文 (EUC)	EUC-CN	x-euc-cn
简体中文 (GB2312)	gb2312	chinese, CN-GB, csGB2312, csGB231280, csISO58GB231280, GB_2312-80, GB231280, GB2312-80, GBK, iso-ir-58
简体中文 (GB18030)	gb18030
简体中文 (HZ)	hz-gb-2312
简体中文 (Mac)	x-mac-chinesesimp
繁体中文 (Big5)	big5	cn-big5, csbig5, x-x-big5
繁体中文 (CNS)	x-Chinese-CNS
繁体中文 (Eten)	x-Chinese-Eten
繁体中文 (Mac)	x-mac-chinesetrad
西里尔语 (DOS)	cp866	ibm866
西里尔语 (ISO)	iso-8859-5	csISOLatin5, csISOLatinCyrillic, cyrillic, ISO_8859-5, ISO_8859-5:1988, iso-ir-144, l5
西里尔语 (KOI8-R)	koi8-r	csKOI8R, koi, koi8, koi8r
西里尔语 (KOI8-U)	koi8-u	koi8-ru
西里尔语 (Mac)	x-mac-cyrillic
西里尔语 (Windows)	windows-1251	x-cp1251
欧罗巴语	x-Europa
德语 (IA5)	x-IA5-German
希腊语 (DOS)	ibm737
希腊语 (ISO)	iso-8859-7	csISOLatinGreek, ECMA-118, ELOT_928, greek, greek8, ISO_8859-7, ISO_8859-7:1987, iso-ir-126
希腊语 (Mac)	x-mac-greek
希腊语 (Windows)	windows-1253
现代希腊语 (DOS)	ibm869
希伯来语 (DOS)	DOS-862
希伯来语 (ISO-Logical)	iso-8859-8-i	logical
希伯来语 (ISO-Visual)	iso-8859-8	csISOLatinHebrew, hebrew, ISO_8859-8, ISO_8859-8:1988, ISO-8859-8, iso-ir-138, visual
希伯来语 (Mac)	x-mac-hebrew
希伯来语 (Windows)	windows-1255	ISO_8859-8-I, ISO-8859-8, visual
IBM EBCDIC (阿拉伯语)	x-EBCDIC-Arabic
IBM EBCDIC (西里尔文俄语)	x-EBCDIC-CyrillicRussian
IBM EBCDIC (西里尔文塞尔维亚语-保加利亚语)	x-EBCDIC-CyrillicSerbianBulgarian
IBM EBCDIC (丹麦-挪威)	x-EBCDIC-DenmarkNorway
IBM EBCDIC (丹麦-挪威-欧洲)	x-ebcdic-denmarknorway-euro
IBM EBCDIC (芬兰-瑞典)	x-EBCDIC-FinlandSweden
IBM EBCDIC (芬兰-瑞士-欧洲)	x-ebcdic-finlandsweden-euro
IBM EBCDIC (芬兰-瑞士-欧洲)	x-ebcdic-finlandsweden-euro	X-EBCDIC-France
IBM EBCDIC (法国-欧洲)	x-ebcdic-france-euro
IBM EBCDIC (德国)	x-EBCDIC-Germany
IBM EBCDIC (德国-欧洲)	x-ebcdic-germany-euro
IBM EBCDIC (现代希腊语)	x-EBCDIC-GreekModern
IBM EBCDIC (希腊语)	x-EBCDIC-Greek
IBM EBCDIC (希伯来语)	x-EBCDIC-Hebrew
IBM EBCDIC (冰岛语)	x-EBCDIC-Icelandic
IBM EBCDIC (冰岛语-欧洲)	x-ebcdic-icelandic-euro
IBM EBCDIC (国际-欧洲)	x-ebcdic-international-euro
IBM EBCDIC (意大利语)	x-EBCDIC-Italy
IBM EBCDIC (意大利-欧洲)	x-ebcdic-italy-euro
IBM EBCDIC (日语和日语片假名)	x-EBCDIC-JapaneseAndKana
IBM EBCDIC (日语和日语-拉丁语)	x-EBCDIC-JapaneseAndJapaneseLatin
IBM EBCDIC (日语和美国-加拿大)	x-EBCDIC-JapaneseAndUSCanada
IBM EBCDIC (日语片假名)	x-EBCDIC-JapaneseKatakana
IBM EBCDIC (朝鲜语和朝鲜语扩展)	x-EBCDIC-KoreanAndKoreanExtended
IBM EBCDIC (朝鲜语扩展)	x-EBCDIC-KoreanExtended
IBM EBCDIC (多语言拉丁语-2)	CP870
IBM EBCDIC (简体中文)	x-EBCDIC-SimplifiedChinese
IBM EBCDIC (西班牙)	X-EBCDIC-Spain
IBM EBCDIC (西班牙-欧洲)	x-ebcdic-spain-euro
IBM EBCDIC (泰语)	x-EBCDIC-Thai
IBM EBCDIC (繁体中文)	x-EBCDIC-TraditionalChinese
IBM EBCDIC (土耳其拉丁语-5)	CP1026
IBM EBCDIC (土耳其语)	x-EBCDIC-Turkish
IBM EBCDIC (英国)	x-EBCDIC-UK
IBM EBCDIC (英国-欧洲)	x-ebcdic-uk-euro
IBM EBCDIC (美国-加拿大)	ebcdic-cp-us
IBM EBCDIC (美国-加拿大-欧洲)	x-ebcdic-cp-us-euro
冰岛语 (DOS)	ibm861
冰岛语 (Mac)	x-mac-icelandic
ISCII 阿萨姆语	x-iscii-as
ISCII 孟加拉语	x-iscii-be
ISCII 梵文	x-iscii-de
ISCII 古吉拉特语	x-iscii-gu
ISCII 埃纳德语	x-iscii-ka
ISCII 马拉雅拉姆语	x-iscii-ma
ISCII 奥里亚语	x-iscii-or
ISCII 旁遮普文	x-iscii-pa
ISCII 泰米尔语	x-iscii-ta
ISCII 泰卢固语	x-iscii-te
日语 (EUC)	euc-jp	csEUCPkdFmtJapanese, Extended_UNIX_Code_Packed_Format_for_Japanese, x-euc, x-euc-jp
日语 (JIS)	iso-2022-jp
日语 (JIS-允许 1 个字节的假名-SO/SI)	iso-2022-jp	_iso-2022-jp$SIO
日语 (JIS-允许 1 个字节的假名)	csISO2022JP	_iso-2022-jp
日语 (Mac)	x-mac-japanese
日语 (Shift-JIS)	shift_jis	csShiftJIS, csWindows31J, ms_Kanji, shift-jis, x-ms-cp932, x-sjis
韩语	ks_c_5601-1987	csKSC56011987, euc-kr, iso-ir-149, korean, ks_c_5601, ks_c_5601_1987, ks_c_5601-1989, KSC_5601, KSC5601
朝鲜语 (EUC)	euc-kr	csEUCKR
朝鲜语 (ISO)	iso-2022-kr	csISO2022KR
朝鲜语 (Johab)	Johab
朝鲜语 (Mac)	x-mac-korean
Latin 3 (ISO)	iso-8859-3	csISO, Latin3, ISO_8859-3, ISO_8859-3:1988, iso-ir-109, l3, latin3
Latin 9 (ISO)	iso-8859-15	csISO, Latin9, ISO_8859-15, l9, latin9
挪威语 (IA5)	x-IA5-Norwegian
OEM 美国	IBM437	437, cp437, csPC8, CodePage437
瑞典语 (IA5)	x-IA5-Swedish
泰语 (Windows)	windows-874	DOS-874, iso-8859-11, TIS-620
土耳其语 (DOS)	ibm857
土耳其语 (ISO)	iso-8859-9	csISO, Latin5, ISO_8859-9, ISO_8859-9:1989, iso-ir-148, l5, latin5
土耳其语 (Mac)	x-mac-turkish
土耳其语 (Windows)	windows-1254	ISO_8859-9, ISO_8859-9:1989, iso-8859-9, iso-ir-148, latin5
Unicode	unicode	utf-16
Unicode (Big-Endian)	unicodeFFFE
Unicode (UTF-7)	utf-7	csUnicode11UTF7, unicode-1-1-utf-7, x-unicode-2-0-utf-7
Unicode (UTF-8)	utf-8	unicode-1-1-utf-8, unicode-2-0-utf-8, x-unicode-2-0-utf-8
US-ASCII	us-ascii	ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, csASCII, IBM367, ISO_646.irv:1991, ISO646-US, iso-ir-6us
越南语 (Windows)	windows-1258
西欧语 (DOS)	ibm850
西欧语 (IA5)	x-IA5
西欧语 (ISO)	iso-8859-1	cp819, csISO, Latin1, ibm819, iso_8859-1, iso_8859-1:1987, iso8859-1, iso-ir-100, l1, latin1
西欧语 (Mac)	macintosh
西欧语 (Windows)	Windows-1252	ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, cp819, csASCII, IBM367, ibm819, ISO_646.irv:1991, iso_8859-1, iso_8859-1:1987, ISO646-US, iso8859-1, iso-8859-1, iso-ir-100, iso-ir-6, latin1, us, us-ascii, x-ansi

时间： 2024-10-13 00:08:26

各个国家所对应的字符集列表的相关文章

oracle18c字符集列表

# Specify the Starter Database character set.## One of the following# AL32UTF8, WE8ISO8859P15, WE8MSWIN1252, EE8ISO8859P2,# EE8MSWIN1250, NE8ISO8859P10, NEE8ISO8859P4, BLT8MSWIN1257,# BLT8ISO8859P13, CL8ISO8859P5, CL8MSWIN1251, AR8ISO8859P6,# AR8MSWI

oracle11g修改字符集的问题

oracle 11g数据库修改字符集 NLS_CHARACTERSET我安装数据库的时候设置为ZHS16GBK,而开发需要的UTF8 据开发反应改DB的原因是:因为DB不支持中文,向数据库表中插入一条数据的时候,中文就都变了类似于"?(是反问号)"的乱码, 为了能顺利插入成功,故做了此次修改; 查询字符集参数可以查询以下数据字典或视图查看字符集设置情况 nls_database_parameters.props$.v$nls_parameters 查询结果中NLS_CHARACTE

Oracle出现字符集问题处理方法

1. Cmd进去DOS 2. 再输入dbca(database create) 3. 弹出的界面,直接下一步,选择删除数据库 4. 成功删除后,回到一第一界面,选择创建数据库,下一步. 5. 选择:定制数据库(new database),下一步 6. 输入全局数据库名与sid要相同.下一步,一直到第十步. 7. 到第十步有四个选项(内存.调整大小.字符集.连接模式),选择字符集选项卡,选择“从字符集列表中选择”的单选按钮.在里面可以选择自己想要的字符集.

利用Python抓取亚马逊评论列表数据

前段时间,我家妹子公司老板叫她去将法国亚马逊评论列表的前100页共1000个评论用户的联系方式找出来.1000个用户,要一个个的去看再记录下来,而且并不是每个评论用户都会将个人的联系方式留下来.那么问题来了,这样费时费力的工作如果人工去做的话,那么就是花了两天的时间也就找了前30页的数据(还有别的工作要做),然后累的够呛的.本着心疼的原则(程序猿能找到妹子就很不错了,所以得心疼着),就想帮着她做点事. 我本身的工作是做游戏客户端开发的,主要使用的开发语言是lua和c++,并没有接触过网页.网站相

Windows改动cmd字符集

在中文Windows系统中,假设一个文本文件是UTF-8编码的,那么在CMD.exe命令行窗体(所谓的DOS窗体)中不能正确显示文件里的内容.在默认情况下,命令行窗体中使用的代码页是中文或者美国的,即编码是中文字符集或者西文字符集. 假设想正确显示UTF-8字符,能够依照下面步骤操作: 1.打开CMD.exe命令行窗体 2.通过 chcp命令改变代码页,UTF-8的代码页为65001 chcp 65001 运行该操作后.代码页就被变成UTF-8了.可是,在窗体中仍旧不能正确显示UTF-8字符.

Linux - 查看和更改系统字符集

查看当前系统字符集 $ echo $LANG en_US.UTF-8 $ $ env |grep LANG LANG=en_US.UTF-8 $ $ locale |grep CTYPE LC_CTYPE="en_US.UTF-8" $ 更改系统字符集执行export LANG=<字符集名称>或者export LC_ALL=<字符集名称>命令,可以临时修改系统字符集执行unset LANG命令可以取消当前系统字符集执行locale -a命令查看标准字符集列

关于计算机的字符集

1.计算机的字符集有三种单字节字符集(SBCS).多字节字符集(MBCS).宽字节字符集(Unicode字符集).计算机的每个字符都要使用一个编码表示,每个字符集使用哪一种编码则是由所采用的字符集所决定. 单字节字符集:它的所有字符都只有一个字节的长度.具体实现有:ASCII字符集和扩展ASCII字符集. 多字节字符集:英文和欧洲字符采用一个字节表示,其他国家如中文采用2个字节表示.各个国家有自己的字符集. 操作系统通过代码页给各种字符集定义编号,便于区分. 包含多字节字符集的中文信息软件不能

Oracle数据库多语言文字存储解决方案

一.关于字符集字符集(也称字元集,Character Set)就是字符编码表(codepage),一个字符不论英文.中文.韩文等在计算机系统内存或硬盘中通过二进制的字节(Byte)保存,这个二进制的编码就是字符编码(也称内码),字符集就是字符与内码的对应(映射)表. 因为多国语言的原因,就出现了根据本国语言制作的字符集.如使用最广泛的ASCII编码,由美国国家标准局(即ANSI)制定,适用于所有拉丁.英文字符.中国大陆使用GB2312,GBK,GB18030等字符集,这些字符集包含所有汉字字符

node.js网页爬虫

使用node开发一个小工具,扫描分子反应动力国家重点实验室新闻动态列表页前三页的信息(地址如下:http://www.sklmr.dicp.ac.cn/list.php?tid=1)要求打印出新闻名称,链接地址,发布时间. 例如在控制台打印韩克利入选2016年度"中国科学院特聘研究员"计划 2016-06-14 http://www.sklmr.dicp.ac.cn/show.php?id=521 我室金属表面解离吸附动力学理论研究取得新进展 2016-06-12