Linux系统下转换文件编码的方法

1.利用iconv命令进行文件内容编码转换

    

用法: iconv [选项...] [文件...]

有如下选项可用:

输入/输出格式规范:
-f, --from-code=名称 原始文本编码
-t, --to-code=名称 输出编码

信息:
-l, --list 列举所有已知的字符集

输出控制:
-c 从输出中忽略无效的字符
-o, --output=FILE 输出文件
-s, --silent 关闭警告
--verbose 打印进度信息

-?, --help 给出该系统求助列表
--usage 给出简要的用法信息
-V, --version 打印程序版本号

eg:

iconv -f gb2312 -t utf-8 1.txt > 2.txt

这个命令读取1.txt文件,从gb2312编码转换为utf-8编码,其输出定向到2.txt文件。
注:windows下写字板生成的txt一般是gb18030编码,如果指定错误会报如下错误:
iconv: 未知 6071 处的非法输入序列

2.文件名编码转换

因为现在用linux,原来在windows里的文件都是用GBK编码的。所以copy到linux下是乱码,文件内容可以用iconv来转换可是好多中文的文件名还是乱码,找到个可以转换文件名编码的命令,就是convmv。
convmv命令详细参数

eg:

convmv -f GBK -t UTF-8 *.mp3

不过这个命令不会直正的转换,你可以看到转换前后的对比。如果要直正的转换要加上参数 --notest

convmv -f GBK -t UTF-8 --notest *.mp3

-f 参数是指出转换前的编码,-t 是转换后的编码。这个千万不要弄错了。不然可能还是乱码哦。还有一个参数很有用。就是 -r 这个表示递归转换当前目录下的所有子目录。

* 需要安装 convmv-1.10-1.el5.noarch.rpm

3.傻瓜型命令行工具enca

安装:

yum install enca -y

查看当前文件编码

enca -L zh_CN ip.txt
Simplified Chinese National Standard; GB2312
Surrounded by/intermixed with non-text data

文件格式转换:

enca -L zh_CN -x utf-8 *
检查文件的编码 
enca -L zh_CN file

将文件编码转换为"UTF-8"编码 

enca -L zh_CN -x UTF-8 file

如果不想覆盖原文件可以这样,这样:

enca -L zh_CN -x UTF-8 < file1 > file2

查看编码的方法:

 a.    

 
file filename

b.在Vim中可以直接查看文件编码

 :set fileencoding
时间: 2024-10-24 17:51:03

Linux系统下转换文件编码的方法的相关文章

linux系统下修改文件夹目录权限

linux系统下修改文件夹目录权限 文件夹权限问题 Linux.Fedora.Ubuntu修改文件.文件夹权限的方法差不多.很多人开始接触Linux时都很头痛Linux的文件权限问题.这里告诉大家如何修改Linux文件-文件夹权限.以主文件夹下的一个名为cc的文件夹为例. 下面一步一步介绍如何修改权限: 1.打开终端.输入su(没 Linux.Fedora.Ubuntu修改文件.文件夹权限的方法差不多.很多人开始接触Linux时都很头痛Linux的文件权限问题.这里告诉大家如何修改Linux文件

Linux系统下目录文件配置

刚刚接触Linux,对于Linux系统下的目录配置进行了一些研究,为了避免以后误操作这些目录,建议大家还是记忆一下相关的配置! 总结 Linux 根目录主要配置 目录 文件配置内容 /bin 单用户维护模式下还能被操作的命令 /boot 开机会使用到的文件,包括Linux内核文件以及开机菜单与开机所需配置文件 /dev 设备以及设备接口文件,访问该目录下文件相当于访问某设备 - /dev下的重要文件:/dev/null,/dev/zero,/dev/tty /etc 系统主要的配置文件,比如账号

Windows系统下查看文件编码类型

这是一个程序员的最基本的技能,原谅我到现在才去了解 以前只知道window操作系统下文件大部分默认编码是ANSI,中文版是GBK编码 如果想要查看或者修改文件编码的话有两种方式 一:用记事本打开文件,另存为 可以查看,和修改文件编码 二:另一种就是通过工具喽,notepad++,程序员必备工具了 通过工具打开文件 默认选中的就是当前文件编码类型.这里你可以修改文件的编码,基本上我会使用encode in UTF-8 without BOM 这里,和UTF-8的具体区别,可以参考 http://w

Linux平台下转换文件的字符集

由于一些原因,我们经常会遇到Linux服务器下面显示乱码的问题,这是因为客户端,服务器,文件的字符集编码不一致导致的,这里我们说一下如何转换文件的字符集. 转换文件的字符集可以使用命令: iconv -f {转换前字符集} -t {转换后的字符集} inputfile -o outputfile 注意,如果不指定-o参数的话,那么iconv只在平面上面打印文件,但是不会改变原来文件的字符集属性. 例如:我们需要将一个文件从utf-8 转换为 gb18030,命令如下: iconv -f utf-

Linux系统下tar文件安装方法

将安装文件拷贝至你的目录中 如果是以root身份登录上的,就将软件拷贝至/root中. cp xxx.tar.gz /root 解压缩包 tar xvzf xxx.tar.gz 切换到安装目录下 cd xxx 执行安装 ./configure make make install 各命令解释如下: configure检查编译 make开始进行编译 make install 开始安装 安装完毕,清除编译过程中产生的临时文件和配置过程中产生的文件. make clean make distclean

如何在linux系统下对文件夹名有空格的文件夹进行操作

http://www.2cto.com/os/201409/335119.html 在Windows操作系统中可以轻易地创建\移动\删除文件夹名带有空格的文件夹, 而在linux则需要进行一些特殊的处理才能实现以上功能. (1)创建文件夹 mkdir my\ first 这条命令创建了文件夹"my first",文件夹名中my和first之间有一个空格,在命令行中需要 添加一个"\"符号和一个空格的组合 mkdir my\ \ tow 这条命令创建了文件夹"

Linux系统下ZIP文件解压和压缩命令

zip all.zip *.jpg   #将所有.jpg的文件压缩成一个zip包 unzip all.zip    #将all.zip中的所有文件解压到当前目录中 unzip all.zip -d all #将all.zip 中的所有文件解压到当前目录中的all文件夹中 zip -r hy.zip hy  #将当前目录下的hy文件夹压缩为hy.zip zip -r hy.zip hy 123.txt  #将当前目录下的hy文件夹和123.txt压缩为hy.zip 作者:open210 来源:CS

linux系统下修改文件夹权限及其子文件夹权限

root用户下 chmod -R 777 eclipse

PhantomJS linux系统下安装步骤及使用方法

PhantomJS 是一个基于 WebKit 的服务器端 JavaScript API.它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG. PhantomJS 可以用于 页面自动化 , 网络监测 , 网页截屏 ,以及 无界面测试 等. 我用的是网页截屏功能,下面是我操作过程中的安装步骤及网页截屏功能测试. 第一步:phantomjs安装debian和ubunto安装命令  sudo apt-get ins