Linux中cut,sort,uniq和wc的用法

一.cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。
1.语法格式为:
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
2.使用说明
cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。
3.主要参数
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。

二.sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出.
-u : 它的作用很简单,就是在输出行中去除重复行。
-r : sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。
-o : 把sort的标准输出到原文件中去。
-n : 以数值来进行排序。
你有没有遇到过10比2小的情况。我反正遇到过。出现这种情况是由于排序程序将这些数字按字符来排序了,排序程序会先比较1和2,显然1小,所以就将10放在2前面喽。这个时候就要用到-n选项了。
-t : 指定分隔符
-k : 指定分隔符后,指定列数。
-f : 忽略大小写

三.uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作用,所有的重复行必须是相邻的。
-i :忽略大小写字符的不同;
-c :进行计数,显示文件中每行连续出现的次数。
-u :只显示唯一的行
-d : 显示文件中连续重复出现的行。
注意:uniq通常和sort一起使用,因为uniq去重的前提是重复的行必须是相邻的,所以在使用时,先用sort进行排序,然后再使用uniq。

四.wc统计文件里面有多少单词,多少行,多少字符。
-l :仅列出行;
-w :仅列出多少字(英文单字);
-m :多少字符;

原文地址:http://blog.51cto.com/13120271/2327404

时间: 2024-10-03 10:22:13

Linux中cut,sort,uniq和wc的用法的相关文章

linux中vim编辑器各种常用命令及用法

linux中vim编辑器的常用命令以及用法(注意严格区分大小写以及中英文): vim编辑器有三种模式,分别是:编辑模式,输入模式以及末行模式. 模式转换: 编辑模式>>>输入模式: i:在光标所在字符前面,转为输入模式(即转完后在光标所在字符前输入):                      I:在光标所在行的行首,转为输入模式(即转完后在行首输入,不包括行首空                         白) a:在光标所在字符后,转为输入模式(即转完后在光标所在字符后面输入):

Linux中chown和chmod的区别和用法

Linux中chown和chmod的区别和用法(转) chmod修改第一列内容,chown修改第3.4列内容: chown用法: 用来更改某个目录或文件的用户名和用户组. chown 用户名:组名 文件路径(可以是绝对路径也可以是相对路径) 例1:chown root:root /tmp/tmp1 就是把tmp下的tmp1的用户名和用户组改成root和root(只修改了tmp1的属组). 例2:chown -R root:root /tmp/tmp1 就是把tmp下的tmp1下的所有文件的属组都

0219自学Linux_bash特性+命令学习(cut,sort,uniq,wc,tr,histroy,alias)+通配符glob

09 GPL,BSD,Apache三个开源协定的大体联系及其区别 1.自由软件,版权描述:但是照样是有版权的 2.开源协定,版权描述 www.kernel.org内核版本的版本号查看网址,也是官网 查看最新kernel的最新版本,www.kernel.org习惯了解 列出linux发行版和linux内核的关系 Lniux发行版,GUN:GUN/Linux. 源代码:必须要编译才可以运行,所以发行版是已经将源代码已经编译完成的东西,组合在一起,就形成了发行版,主流的三大发行版:Fedora:它为r

[linux] grep awk sort uniq学习

grep的-A-B-选项详解grep能找出带有关键字的行,但是工作中有时需要找出该行前后的行,下面是解释1. grep -A1 keyword filename找出filename中带有keyword的行,输出中除显示该行外,还显示之后的一行(After 1)2. grep -B1 keyword filename找出filename中带有keyword的行,输出中除显示该行外,还显示之前的一行(Before 1)3. grep -1 keyword filename找出filename中带有k

Linux下命令sort, uniq

标题:sort, uniq 一.sort命令的使用       1. 作用:sort命令顾名思意,其可以帮助我们进行排序,而且可以依据不同的数据类型来排序.例如数字和文字的排序就不一样,sort可以指定不同的选项从而使得排序依据也不同,影响排序结果. 2. 选项: -f:忽略大小写的差异,例如A与a视为编码相同: -b:忽略最前面的空格部分: -M:以月份的名字来排序,例如JAN,DEC等的排序方法: -n:使用“纯数字”进行排序(默认是以文字类型来排序的): -r:反向排序 -u:uniq,

Linux基础之文本处理命令(wc,cut,sort,uniq,diff,patch)

我相信大家在使用Linux过程中总会遇到想要提取某些自己需要的信息的情况,比如如下这四种情况: 1.找出ifconfig命令结果中eno16777728的IPv4地址 2.查出分区空间使用率的最大百分比值 3.查出/tmp的权限,以数字方式显示 这个时候,我们使用命令当然也可以查看,不过还需要自己通过眼睛去过滤不需要的信息,多费劲.如何让自己更轻松的看到自己想看到自己想看的信息呢?今天的文本处理命令能满足我们的简单需求. wc 此wc非彼WC,在这里wc是word count的简写 wc - p

linux cat,tac,more,less,head,tail,cut,sort,uniq,wc,tr命令的使用

cat:连接并显示,比如: [[email protected] ~]# cat /tmp/sort.test  111 324 567 324 890 890 567 abc 加上选项-n会显示行号: [[email protected] ~]# cat -n /tmp/sort.test      1111      2324      3567      4324      5890      6890      7567      8abc 加上-E选项会显示行尾符$:(linux中行尾

linux系统中cut sort tee 和uniq命令的使用

cut命令的使用 -----分割  [[email protected] wang]# cut -d ':' -f 1 passwd1 |head -n3  //cut命令用于切割.-d后面指  定分隔符,用单引号引起来  root                                                           //-f指定第几段.即用分隔符分割后的第几段  bin daemon   [[email protected] wang]# cut -c1 pass

linux常用命令-文本处理cut,sort,uniq,wc,tr

cut:截取文本特定字段 NAME       cut - remove sections from each line of files -d, --delimiter=DELIM(指定字段分隔符,默认是空格) use DELIM instead of TAB for field delimiter -f, --fields=LIST(指定要显示的字段) select  only  these  fields;  also print any line that contains no del