输入 ALT + 50385 就出 难 字了,原因是它的十六进制ANSI编码是C4D1=50385
同理:
汉=BABA=47802
字=D7D6=55254
中=D6D0=54992
文=CEC4=52932
国=B9FA=47610
华=BBAA=48042
夏=CFC4=53188
吴=CEE2=52962
但不知这种方法只支持GB2312,还是支持GBK,估计是GBK(即当前的ANSI编码)
这种方法还可输入ANSI和扩展ANSI:
A=65
€=128
À=192
æ=230
同时查得Unicode编码:
汉=FFFE49=16776777,输出结果却是:蘒
字=6C575B=7100251,输出结果却是:W
可见的这种输入方法不支持Unicode
----------------------------------------------------------
GBK定义之字符较CP936多出95字,皆为其时未收入ISO 10646 / Unicode之符号。CP936中的这95字分配到了Unicode的私有区域,现已全部收于新版Unicode。
因此,现在GBK的所有字符已经全部收录于Unicode中。
UTF-8作为Unicode的一种编码方法,可以表述所有的Unicode字符。
结论:UTF-8可以表述所有的GBK字符。
----------------------------------------------------------
GBK对应的code page是CP936。
微软也为GB18030定义了code page:CP54936
GBK是GB2312的扩展,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。
在简体中文windows系统下,ANSI编码代表GBK/GB2312编码,ANSI通常使用0x80~0xFF范围的2个字节来表示1个中文字符。0x00~0x7F之间的字符,依旧是1个字节代表1个字符。Unicode(UTF-16)编码则所有字符都用2个字节表示。