1.对编码的个人理解
一类是ASCII码,学C语言时接触到的,只能编码基本字符;
另外就是ANSI编码和UNICODE编码,这两类是编码标准,他有多种实现(就像H264标准一样)。
对于ANSI编码标准,简体中文对其实现有GBK, GB2312, GB18030 等编码(就像AVC一样,是H264标准的一种实现),繁体中文,日文有其他编码实现.
对于UNICODE编码标准,是国际通用编码,具体实现有 UTF-16 UTF-16LE UTF-16BE UCS-2 UTF-8等。
win8与ubututu编码名称对应关系如下
Windows(win8 enterprise x64 zh) notepad |
linux(ubuntu14.04 x64 en) gedit |
|
ANSI |
GB2312 GB18030 GBK |
Chinese simplified |
UNICODE |
UTF-16 UTF-16LE UCS-2 |
UNICODE |
UNICODE big endian |
UTF-16 UTF-16BE |
|
UTF-8 |
UTF-8 |
|
时间: 2024-11-25 10:56:37