今天将windows代码移植到Linux下,其中用到了Unicode转char的函数,被坑了一会,相关函数及编码格式,Linux与windows不同,有几点需要注意:
1、wchar_t 在Linux下占用4个字节,在windows下占2个字节;
2、Linux默认的文本编码方式是UTF-8;Linux终端汉字显示的设置方式:vi /etc/sysconfig/i18n;
设置LANG=“en_US.UTF-8”或者LANG=“zh_CN.UTF-8”;
3、iconv函数的调用方式:
iconv(iconv_t en, char** inbuf, size_t inlen, char** outbuf, size_t outlen);
段错误引发的关键之处就在这里了。
对于输入buffer与输出buffer,我之前用的是数组:strin[N][strlen];而我每次只处理二维数组中的一个数组,于是inbuf = (char**)(&strin[i]);
outbuf也是以类似的方式定义的,这样执行下去就一直报段错误,或者说segment error;
修改成这样就行了:
char* intemp = strin[i]; inbuf = &intemp;
outbuf也以类似的方式定义及解决问题。
4、Linux还有一个系统小工具iconv,
可以通过指令
iconv --list
来看Linux支持哪些文本格式,Unicode格式的名字可以填:UNICODE、UCS-2
还可以通过指令:
iconv -f UCS-2 -t UTF-8 test.txt -o output.txt
来测试格式转码是否能成功。
指令的含义:
iconv -f from_encoding -t to_encoding inputfile -o outputfile
5、另外还有个问题,在windows下通过tinyxml写XML文本,需要指定GBK格式,而在Linux下通过tinyxml写XML文件需要指定UTF-8编码;否则生成的XML文件为乱码。
linux下转格式函数iconv段错误,布布扣,bubuko.com
时间: 2024-10-28 22:53:49