下面是字符、字节、编码格式的基础知识:
http://www.regexlab.com/zh/encoding.htm
程序中涉及的会有几次的编码格式的转换:
1. 代码文本,字符串是按我们文本设定的编码方式保存的
2. 代码运行期间,字符串在内存中是以一种编码方式保存的
3. 代码如果产生字符串输出,输出到问题的字符串不同的IO类会产生不同编码方式的保存,当然这个可以设置实现更改
因为同一个字符串存在了3次的编码格式切换,所以这里3个地方的实际存储的字节长度会可能不一样。
另外如果对字符串进行字节流处理,要格外小心,不要确认具体的编码方式(汉字:Unicode编码 2字节, UTF8编码3字节,ANSI编码看具体的本地化编码)。
版权声明:本文为博主原创文章,未经博主允许不得转载。博主联系方式:[email protected]。
时间: 2024-10-12 17:55:03