windows 上默认的简体中文字符编码是GBK,而Linux是UTF-8(这里的描述好像并不准确,字符编码与字符集应该不是一回事,还没搞清楚)。
查看文件编码:(enca 软件包可能并没有默认安装,用apt-get install enca或yum install enca等命令安装即可):
- $ enca filename
GB2312编码的文件输出:
- Simplified Chinese National Standard; GB2312
- CRLF line terminators
将文件编码转换成UTF-8:
- $ iconv -f GB2312 -t UTF-8 filename > newfilename
- //注: Filename 与 Newfilename 不要相同 否则为空。
此时用enca命令查看newfilename,输出:
- Universal transformation format 8 bits; UTF-8
- CRLF line terminators
时间: 2024-10-23 20:31:11