Linux shell 命令 转换文件的字符编码

windows 上默认的简体中文字符编码是GBK,而Linux是UTF-8(这里的描述好像并不准确,字符编码与字符集应该不是一回事,还没搞清楚)。

查看文件编码:(enca 软件包可能并没有默认安装,用apt-get install enca或yum install enca等命令安装即可):

  1. $ enca filename

GB2312编码的文件输出:

  1. Simplified Chinese National Standard; GB2312
  2. CRLF line terminators

将文件编码转换成UTF-8:

  1. $ iconv -f GB2312 -t UTF-8 filename > newfilename
  2. //注: Filename 与 Newfilename  不要相同 否则为空。

此时用enca命令查看newfilename,输出:

  1. Universal transformation format 8 bits; UTF-8
  2. CRLF line terminators
时间: 2024-10-23 20:31:11

Linux shell 命令 转换文件的字符编码的相关文章

在Linux如何让更改文件的字符编码

问题:在我的 Linux 系统中有一个编码为 iso-8859-1 的字幕文件,其中部分字符无法正常显示,我想把文本改为 utf8 编码.在 Linux 中, 有没有一个好的工具来转换文本文件的字符编码? 正如我们所知道的那样,电脑只能够处理低级的二进制值,并不能直接处理字符.当一个文本文件被存储时,文件中的每一个字符都被映射成二进制值,实际存储在硬盘中的正是这些“二进制值”.之后当程序打开文本文件时,所有二进制值都被读入并映射回原始的可读字符.只有当所有需要访问这个文件的程序都能够“理解”它的

linux shell命令向文件内特定的行插入数据,如注释等

1 文本1.txt为样例文件,内容为10行样例 2 向第2行到第7行的内容添加注释 命令如下: 使用sed命令 -i 直接修改读取的文件内容,而不是输出到终端 s代表替换 s前面的数字,代表需要添加的行数 ^代表行首 $代表行尾 &后面接添加的内容 :分号代表可以写多个条件 最后加文件名字,命里组合如下 sed -i '2s/^/&<!-- /;7s/$/& -->/' 1.txt 文件太长可以用截图的命令 -n 只显示匹配处理的行 '2,7p'  处理第2到7行 se

Gnu Linux下文件的字符编码及转换工具

/*********************************************************************  * Author  : Samson  * Date    : 07/03/2014  * Test platform:  *              3.11.0-12-generic #19-Ubuntu  *              GNU bash, version 4.2.45  * ****************************

linux shell 命令学习(5) xxd- make a hexdump or do the reverse.

对于标准输入或者给定的文件,显示其16进制的内容.也可以反过来进行转换. ? 1 2 3 xxd -h[elp] xxd [options] [infile [outfile]] xxd -r[evert] [options] [infile [outfile]] 如果没有指定输入文件, 则采用标准输入. -b: 以2进制格式进行输出 ? 1 2 3 4 [[email protected] src]$ xxd -b train.ini 0000000: 01011011 01110100 01

Linux shell命令中expr

在Linux shell命令中expr虽然不是很起眼,但是它的作用是非常大的!到目前为止,我个人看来最大的作用就是两个——四则运算和字符串的操作. 先说四则运算,在Shell中四则运算不能简简单单的加减乘除,应该要写如下的格式: $val1=`$val2 - 1` 其中“=”后面用“`”包住表达式,这个符号在Shell中十分有用,是Tab键上面“~”的原来形式.可以用来将很多命令的结果保存到一个变量中去.接着就是运算符了,运算符的左右两边必须是空格,否则会出错. 接着是强大的字符串操作: 提取指

Linux Shell命令总结

使用find命令找到大于指定大小的文件: find /-type f -size +10G 在Linux下如何让文件夹下的文件让文件按大小排序? 方法一:# ls -lhSl 长格式显示,h human readable模式,大小单位为M,G等易读格式,S size按大小排序: 方法二:# du -h | sort -n 当然您也可以结合管道查看文件夹内最大的几个文件或最小的几个文件, 再加上管道符号和head或者tail命令即可du -h | sort -n|head du -h * | so

37条常用Linux Shell命令组合

序号 任务 命令组合 1 删除0字节文件 find . -type f -size 0 -exec rm -rf {} \; find . type f -size 0 -delete 2 查看进程,按内存从大到小排列 ps -e -o “%C : %p : %z : %a”|sort -k5 -nr 3 按cpu利用率从大到小排列 ps -e -o “%C : %p : %z : %a”|sort -nr 4 打印说cache里的URL grep -r -a jpg /data/cache/*

JAVA基础学习day22--IO流四-对象序列化、管道流、RandomAccessFile、DataStream、ByteArrayStream、转换流的字符编码

一.对象序列化 1.1.对象序列化 被操作的对象需要实现Serializable接口 1.2.对象序列化流ObjectOutputStream与ObjectInputStream ObjectInputStream 对以前使用 ObjectOutputStream 写入的基本数据和对象进行反序列化. ObjectOutputStream 和 ObjectInputStream 分别与 FileOutputStream 和 FileInputStream 一起使用时,可以为应用程序提供对对象图形的

常用Linux Shell命令组合

序号 任务 命令组合 1 删除0字节文件 find . -type f -size 0 -exec rm -rf {} \;find . type f -size 0 -delete 2 查看进程,按内存从大到小排列 ps -e -o “%C : %p : %z : %a”|sort -k5 -nr 3 按cpu利用率从大到小排列 ps -e -o “%C : %p : %z : %a”|sort -nr 4 打印说cache里的URL grep -r -a jpg /data/cache/*