linux编码

转:

Linux查看文件编码格式及文件编码转换

如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。

查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim 中可以直接查看文件编码

Shell代码

  1. :set fileencoding

即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:

Shell代码

  1. set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。
2. enca (如果你的系统中没有安装这个命令,可以用sudo yum install-y enca 安装 )查看文件编码
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:
Unrecognized encoding

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

Shell代码

  1. :set fileencoding=utf-8

2. enconv转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2

时间: 2024-10-12 16:56:56

linux编码的相关文章

修改linux编码

Windows的默认编码为GBK,Linux的默认编码为UTF-8.在Windows下编辑的中文,在Linux下显示为乱码.为了解决此问题,修改Linux的默认编码为GBK. 修改Linux编码方法有两种:1:vi   /etc/sysconfig/i18n默认为:LANG="en_US.UTF-8"SYSFONT="latarcyrheb-sun16"修改为:LANG="zh_CN.GBK"SUPPORTED="zh_CN.UTF-8

linux编码转换问题

一.windows下默认编码GBK.windows下编写的cpp文件默认GBK编码.代码中如果有常量字符串,字符串的编码格式跟代码文件的编码格式一致. 二.linux下默认编码是utf8.linux要把GBK编码转换成utf8编码需要使用iconv库.但是如果直接把GBK转成UTF8,会出现有些字符串能正常转换,有些转换后是乱码.正确的转换方式,先将GBK转成unicode,再将unicode转成utf8,最后未发现乱码. 原文地址:https://www.cnblogs.com/wsswlyy

linux 编码转换 任意编码转换 通用转换 当无法确认源编码时 一个批量转换脚本

转载请注明出处:http://www.cnblogs.com/blazer/p/7808639.html 一个比较通用的方法,将所有系统已有编码,都转换一遍,从结果中去筛选你需要的编码. 如果你执行: sh test.sh t1.csv,则会生成t1.csv.head.result文件,你需要从中去筛选需要的编码. 执行命令: sh test.sh $fileName 脚本文件: if [ "$1" == "" ]; then echo "Usage :

linux编码风格(转)

1.https://wenku.baidu.com/view/29009a84bceb19e8b8f6badc.html 2.http://blog.csdn.net/stuartguo/article/details/52065642 Chinese translated version of Documentation/CodingStyle If you have any comment or update to the content, please post to LKML direc

windows环境下pycharm如何设置Linux编码

最近写代码一直在windows环境下,写完之后再传到Linux端就会出现代码格式错乱. 解决办法: 在windows端的pycharm代码格式设置为unix and os及可以解决这个问题. 如果你要问为什么不直接设置成远程连接Linux? 你以为我不想,是我不能,公司电脑用的是社区版,没有这个功能. 原文地址:https://www.cnblogs.com/itpython/p/10447173.html

java字符集编码乱码问题

博客分类: web javajspservlet 最近做网页这块时碰到了正文字符乱码问题.别看这小小的一个问题,对我来说却花费了好长一段时间.现在让我慢慢分析它吧(说实话.这些有部分是从网上找的,但都是自己亲自打出来的.这样对自己来说不仅理解了而且还加深了印象).  在java内部运算中.涉及到所有字符串都会被转化UTF-8编码来运算,然而.在被java转化之前,字符串是怎么样的字符集呢?其实java总是根据操作系统的默认编码字符集来决定字符串的初始编码的:而且java系统的输入输出都是采取操作

Linux设备驱动开发基础

1.驱动概述和开发环境搭建 1.1驱动设备的作用 对设备驱动最通俗的解释就是"驱动硬件设备行动".驱动与底层硬件直接打交道,按照硬件设备的具体工作方式,读写设备的寄存器,完成设备的轮训.中断处理.DMA通信,进行物理内存向虚拟内存的映射等,最终让通信设备能收发数据,让显示设备能显示文字和画面,让存储设备能记录文件和数据. 由此可见,设备驱动充当了硬件和应用软件之间的纽带,他使得应用软件只需要调用系统软件的应用编程接口(API)就可让硬件去完成要求的工作.在系统中没有操作系统的情况下,工

转:从开源项目学习 C 语言基本的编码规则

从开源项目学习 C 语言基本的编码规则 每个项目都有自己的风格指南:一组有关怎样为那个项目编码约定.一些经理选择基本的编码规则,另一些经理则更偏好非常高级的规则,对许多项目而言则没有特定的编码规则,项目中的每个开发者使用他自己的风格. 所有代码都保持一致风格的大型库,更容易让人理解. 有许多资源是关于能让人采取的更好的编码规则的,我们可以通过以下方式学到好的编码规则: 阅读书或杂志 浏览网站 与同事交流 参加培训 另一个更有趣的方法是通过研究一个成熟的知名开源项目来得知其开发者是怎样编写代码的.

vim编码设置(转)

vim里面的编码主要跟三个参数有关:enc(encoding).fenc(fileencoding).fence(fileencodings) fenc是当前文件的编码,也就是说,一个在vim里面已经正确显示了的文件(前提是你的系统环境跟你的enc设置匹配),你可以通过改变fenc后再w来将此文件保存成不同的编码.比如说,我:set fenc=utf-8,然后:w,就把文件保存成utf-8的了,:set fenc=gb18030,再:w,就把文件保存成gb18030的了.这个值对于打开文件的时候