文本处理(一)之cut、sort

文本处理

cut:

-d:指定字段分隔符,默认是空格

-f:指定显示的字段

-f 1,3显示1和3列

-f 1-3显示1到3列

例子:cat /etc/passwd |cut -d‘:‘ -f1,3

文本排序

sort:

-n:按数值排序,默认是升序

-r:反序排序

-t:字段分隔符

-k:以那个字段为关键字进行排序

-u:排序后相同的行只显示一次

-f:忽略字符大小写

uniqu:

-d:只显示重复的行

-c:显示某一行重复的次数

wc:

-l:只显示行

-w:单词数

-c:字节数

-m:字符

时间: 2024-10-10 06:09:02

文本处理(一)之cut、sort的相关文章

文本处理工具 wc cut sort uniq

<1> wc 统计字符 行 单词 wc -l wc -w wc -c wc可以可以放在文件前面 也可以放在文件后面,如上图. <2> cut 切 顾名思义就是切割文件用的 作用:是切割一任意行文件的列.... 但是默认按照空格来分割的个格列的 当然可以使用 cut -d 来指定分隔符 如 cut -d: cat -d"22",但是其默认参数必须要跟上-f 指定输出第几列,不指定就会报错 常用的也就-d -f 但是还有一个是以前没用用到过的,就是指定输出分隔符 -

linux常用命令-文本处理cut,sort,uniq,wc,tr

cut:截取文本特定字段 NAME       cut - remove sections from each line of files -d, --delimiter=DELIM(指定字段分隔符,默认是空格) use DELIM instead of TAB for field delimiter -f, --fields=LIST(指定要显示的字段) select  only  these  fields;  also print any line that contains no del

文本处理命令:cut,sort,wc,uniq

文本处理命令:  cut,sort,wc,uniq   cut 选取一段信息中的某一段,处理的信息以"行"为单位. 语法:cut  OPTION... [FILE]... 参数: –d '分割符' –f #    按字符分割,显示第#段 #,#,#: 1,3,5 显示第1 ,3,5段信息 #-#:2-4 显示第2到第四段信息 –c #   以字符的单位取出固定字符区间     多用于排列整齐的信息处理 #-  显示第#个字符之后的值 #-# 显示选定区间的值 示例 [email pro

0219自学Linux_bash特性+命令学习(cut,sort,uniq,wc,tr,histroy,alias)+通配符glob

09 GPL,BSD,Apache三个开源协定的大体联系及其区别 1.自由软件,版权描述:但是照样是有版权的 2.开源协定,版权描述 www.kernel.org内核版本的版本号查看网址,也是官网 查看最新kernel的最新版本,www.kernel.org习惯了解 列出linux发行版和linux内核的关系 Lniux发行版,GUN:GUN/Linux. 源代码:必须要编译才可以运行,所以发行版是已经将源代码已经编译完成的东西,组合在一起,就形成了发行版,主流的三大发行版:Fedora:它为r

Linux基础之文本处理命令(wc,cut,sort,uniq,diff,patch)

我相信大家在使用Linux过程中总会遇到想要提取某些自己需要的信息的情况,比如如下这四种情况: 1.找出ifconfig命令结果中eno16777728的IPv4地址 2.查出分区空间使用率的最大百分比值 3.查出/tmp的权限,以数字方式显示 这个时候,我们使用命令当然也可以查看,不过还需要自己通过眼睛去过滤不需要的信息,多费劲.如何让自己更轻松的看到自己想看到自己想看的信息呢?今天的文本处理命令能满足我们的简单需求. wc 此wc非彼WC,在这里wc是word count的简写 wc - p

文本查看及处理工具:wc, cut, sort, uniq, diff, patch

wc:字符统计,直接使用会依次显示行数.单词数.和字符 wc  [OPTION]...  [FILE]... -l: 行数 -w:单词数 -c: 字符 cut:选取命令,就是将一段数据经过分析,取出我们想要的列,后面必须跟参数使用 cut OPTION... [FILE]... OPTION:     -d CHAR:以指定的字符为分隔符:     -f FIELDS:挑选出的字段:     #:指定的单个字段:     #-#:连续的多个字段:     #,#:离散的多个字段: [[email

Linux学习总结(十八)几个简单的文本处理工具cut sort tr split

1 命令cut 用来截取某一个字段格式 : cut -d '分隔符' [-cf] n, n为数字,表示第几段-d:后面跟分隔符,分割符要加单引号-c:后面接的是第几个字符-f:后面接的是第几段那么意思是-c,-f选项二选一例如: head -3 /etc/passwd |cut -d ':' -f 1例如 head -3 /etc/passwd |cut -c 1-c也可以是一个区间例如 head -3 /etc/passwd |cut -c1-3-c 也可以单独指定好几个位置的字符例如 hea

文本操作3(cut,sort)

需求 检查当前系统中的各种shell程序,统计出它们各被多少用户所使用,并把统计结果按照从多到少排序打印出来 解决方案 每个用户所使用登录的shell都保存在系统文件/etc/passwd中,我们已经知道这个文件中每一行对应一个用户的信息,并且最后一个字段就是这个用户所使用的shell程序.因此可以使用cut命令提取shell程序的字段,在通过sort命令进行合并,然后使用uniq命令统计各个shell的使用次数,最后通过sort命令对数字进行排序. #cut命令从文件中的每一行数据中剪切出一部

cut,sort,uniq,wc

cut cut参数详解 选项 注释 -b 以字节为单位进行分割. -c 以字符为单位进行分割. -d 自定义分隔符,默认为制表符. -f 与-d一起使用,指定显示哪个区域. -n 取消分割多字节字符.仅和 -b 标志一起使用. 注解: cut使用三种定位方式:b(bytes),c(characters),d(fields) cut只擅长处理"以一个字符间隔"的文本内容. sort sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将

linux cat,tac,more,less,head,tail,cut,sort,uniq,wc,tr命令的使用

cat:连接并显示,比如: [[email protected] ~]# cat /tmp/sort.test  111 324 567 324 890 890 567 abc 加上选项-n会显示行号: [[email protected] ~]# cat -n /tmp/sort.test      1111      2324      3567      4324      5890      6890      7567      8abc 加上-E选项会显示行尾符$:(linux中行尾