正则表达式 ------排序三工具（sort、uniq、wc）

一、sort 工具

（1）sort 是一个以行为单位对文件内容进行排序的工具，也可以根据不同的数据类型来排序

（2）sort 命令格式：sort [选项] 参数

（3）常用的选项：

-f：忽略大小写；
-b：忽略每行前面的空格；
-M：按照月份进行排序；
-n：按照数字进行排序；
-r：反向排序；
-u：等同于 uniq，表示相同的数据仅显示一行；
-t：指定分隔符，默认使用[Tab]键分隔；
-o <输出文件>：将排序后的结果转存至指定文件；
-k：指定排序区域；
示例1：将 /etc/passwd 文件中的账号进行排序

sort /etc/passwd

示例2：将/etc/passwd 文件中的第三列进行反向排序

sort -t : -rk 3 /etc/passwd

示例3：将 etc/passwd文件中第三列进行排序，并将输出内容保存至yyy.txt 文件中

sort -t : -k 3 /etc/passwd -o yyy.txt

二、uniq 工具

（1）uniq 工具在 Linux 系统中通常与 sort 命令结合使用，用于报告或者忽略文件中的重复行

（2）命令语法格式为：uniq [选项] 参数

（3）常用选项包括：

-c：进行计数；
-d：仅显示重复行；
-u：仅显示出现一次的行；
示例1：uniq命令去重，只能去连续的重复，如果隔开了还是会出现。

如果我们想去掉所有的重复行，都只出现一次的话，可以使用 sort -u 命令

三、wc 工具

（1）统计指定文件中的字节数、字数、行数，并将统计结果显示输出。该命令统计指定文件中的字节数、字数、行数。如果没有给出文件名，则从标准输入读取。wc同时也给出所指定文件的总统计数。

（2）格式：wc [选项] 文件

（3）常用选项：

-c 统计字节数；
-l 统计行数；
-m 统计字符数，注意这个标志不能与 -c 标志一起使用；
-w 统计字数，一个字被定义为由空白、跳格或换行字符分隔的字符串；
-L 打印最长行的长度；

原文地址：https://blog.51cto.com/14449522/2441525

时间： 2024-12-09 17:27:07

正则表达式 ------排序三工具（sort、uniq、wc）的相关文章

Linux管线命令 - cut,grep,sort,uniq,wc,tee,tr,col,join,paste,expand,split,xargs

在每个管线后面接的第一个数据必定是『命令』喔!而且这个命令必须要能够接受 standard input 的数据才行,这样的命令才可以是为『管线命令』,例如 less, more, head, tail 等都是可以接受 standard input 的管线命令啦.至于例如 ls, cp, mv 等就不是管线命令了!因为 ls, cp, mv 并不会接受来自 stdin 的数据. 也就是说,管线命令主要有两个比较需要注意的地方: 管线命令仅会处理 standard output,对于 standar

05，文本处理cat more less head tail sort uniq wc tr grep cut jion sed awk ok

文本处理cat more less head tail sort uniq grep cut jion sed awk ################################################ cat:concatenate files and print on the standard output 显示文件内容到标准输出(显示器) -e:显示最后一个结尾的字符 -n:显示行编号 [[email protected] ~]# cat -n /etc/shells 1

sort,uniq,wc指令简单用法

sort用于排序,可以根据不同的数据类型来进行排序,例如想要查看最后一个登陆的用户信息,可以把last和sort结合起来使用,按照登陆时间排序. 使用sort排序: sort常用参数: -f :忽略大小写的差异 -b:忽略最前面的空格符部分 -M:以月份的名字排序 -n:使用纯数字排序(默认为以文字类型排序) -r:反向排序 -u:去除重复行,重复的数据只显示一次 -t:分隔符,默认为tab为分隔符 -k:以哪个区间来排序 [[email protected] test]$ last | sor

0219自学Linux_bash特性+命令学习(cut,sort,uniq,wc,tr,histroy,alias)+通配符glob

09 GPL,BSD,Apache三个开源协定的大体联系及其区别 1.自由软件,版权描述:但是照样是有版权的 2.开源协定,版权描述 www.kernel.org内核版本的版本号查看网址,也是官网查看最新kernel的最新版本,www.kernel.org习惯了解列出linux发行版和linux内核的关系 Lniux发行版,GUN:GUN/Linux. 源代码:必须要编译才可以运行,所以发行版是已经将源代码已经编译完成的东西,组合在一起,就形成了发行版,主流的三大发行版:Fedora:它为r

linux cat,tac,more,less,head,tail,cut,sort,uniq,wc,tr命令的使用

cat:连接并显示,比如: [[email protected] ~]# cat /tmp/sort.test 111 324 567 324 890 890 567 abc 加上选项-n会显示行号: [[email protected] ~]# cat -n /tmp/sort.test 1111 2324 3567 4324 5890 6890 7567 8abc 加上-E选项会显示行尾符$:(linux中行尾

linux常用命令-文本处理cut,sort,uniq,wc,tr

cut:截取文本特定字段 NAME cut - remove sections from each line of files -d, --delimiter=DELIM(指定字段分隔符,默认是空格) use DELIM instead of TAB for field delimiter -f, --fields=LIST(指定要显示的字段) select only these fields; also print any line that contains no del

cut,sort,uniq,wc

cut cut参数详解选项注释 -b 以字节为单位进行分割. -c 以字符为单位进行分割. -d 自定义分隔符,默认为制表符. -f 与-d一起使用,指定显示哪个区域. -n 取消分割多字节字符.仅和 -b 标志一起使用. 注解: cut使用三种定位方式:b(bytes),c(characters),d(fields) cut只擅长处理"以一个字符间隔"的文本内容. sort sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将

linux学习记录——sort,uniq,wc,tr

文本排序:sort xx 升序 -n 升序按数值大小 -r 降序 -t 指定字段分隔符 -k 指定以哪个字段为关键字排序 sort -t: -k3 /etc/passwd -u 排序后相同的行只显示一次 -f 忽略大小 uniq 判断是否重复的行.(相邻并且完全相同的行才能算重复的行) 因此可以先用sort排序再uniq -d 只显示重复的行. -D 显示所有重复的行. -c 显示每一行重复的次数 (类似于sql的group by + count ) wc 文本统计 word count

linux下 sort | uniq | wc | less 几个命令的基本用法

sort -f :忽略大小写的差异,例如 A 与 a 视为编码相同: -b :忽略最前面的空格符部分: -M :以月份的名字来排序,例如 JAN, DEC 等等的排序方法: -n :使用『纯数字』进行排序(默认是以文字型态来排序的): -r :反向排序: -u :就是 uniq ,相同的数据中,仅出现一行代表: -t :分隔符,默认是用 [tab] 键来分隔: -k :以那个区间 (field) 来进行排序的意思 uniq -i :忽略大小写字符的不同: -c :进行计数 -u :只显示唯一的行