Shell编程三剑客详解

在Linux/UNIX系统中包含很多文本处理器或文本编辑器,其中grep、sed和awk是shell编程中经常用到的文本处理工具,因此,被业内的人广泛的称之为“shell编程三剑客”

grep命令工具

grep命令工具,在日常生活中,会经常用到,这里也就不多说了,如果有不明白的朋友,请参考博文:Shell脚本应用之正则表达式详解,里面详细介绍了grep命令的相关参数及使用,

sed命令工具

sed是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑,最后输出所有行活仅输出处理的某些行,sed可以在无交互的情况下实现相当复杂的文本处理操作。被广泛的应用于shell脚本中,用于完成各种自动化处理任务。

sed的工作流程主要包括:
1. 读取:sed从输入流中读取一行内容不能够存储到临时的缓冲区中;
2. 执行:默认情况下所有的sed命令都在模式空间中按顺序地执行,除非指定了行的地址,否则sed命令将会再所有行上依次执行;
3. 显示:发送修改后的内容到输出流,再发送数据后,模式空间将会被清空。
注意:在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容都被处理完。

1)sed命令的语法及相关参数:

sed [选项] ‘操作‘  参数
或
sed [选项] -f scriptfile 参数

常见的sed命令选项的主要参数:

如果要求在第几行到第几行之间进行修改等,常见的操作参数包括:

2)sed命令用法示例(注意以下操作不会改变文件本身内容,如果需要修改必须带“-i”选项)

1.输出符合条件的文本
[[email protected] ~]# sed -n ‘p‘ test.txt
//输出所有内容,等同于“cat test.txt”

[[email protected] ~]# sed -n ‘3p‘ test.txt
//输出第三行内容

[[email protected] ~]# sed -n ‘3,5p‘ test.txt
//输出3~5行

[[email protected] ~]# sed -n ‘p;n‘ test.txt
//输出所有奇数行,n表示读入下一行数据

[[email protected] ~]# sed -n ‘n;p‘ test.txt
//输出所有偶数行,n表示读入下一行数据

[[email protected] ~]# sed -n ‘1,5{p;n}‘ test.txt
//输出第1行~第5行之间的奇数行(第1、3、5行)

[[email protected] ~]# sed -n ‘10,${n;p}‘ test.txt
//输出第10行至文件尾部之间的偶数行(包括空行)

sed命令与正则表达式结合使用的案例
sed命令结合正则表达式时,格式略微有些不同,正则表达式以“/”包围

[[email protected] ~]# sed -n ‘/the/p‘ test.txt
//输出包含“the”的行

[[email protected] ~]# sed -n ‘4,/the/p‘ test.txt
//输出从第4行到都第一个包含“the”的行

[[email protected] ~]# sed -n ‘/the/=‘ test.txt
//输出包含“the”的行所在的行号(等号(=)用来输出行号)

[[email protected] ~]# sed -n ‘/^PI/p‘ test.txt
//输出以“PI”开头的行

[[email protected] ~]# sed -n ‘/\<wood\>/p‘ test.txt
//输出包含单词wood的行,\<、\>代表单词边界

2.删除符合条件的文本

nl命令用于计算文件的行数

[[email protected] ~]# nl test.txt | sed ‘3d‘
//删除第3行

[[email protected] ~]# nl test.txt | sed ‘3,5d‘
//删除第3~5行

[[email protected] ~]# nl test.txt | sed ‘/cross/d‘
//删除包含cross的行,原本的第8行被删除

[[email protected] ~]# nl test.txt | sed ‘/cross/! d‘
//删除不包含cross的行

[[email protected] ~]# sed ‘/\.$/d‘ test.txt
//删除以“.”结束的行
[[email protected] ~]# sed ‘/^$/d‘ test.txt
//删除所有空行
[[email protected] ~]# sed -e ‘/^$/{n;/^$/d}‘ test.txt
//删除空行,连续的空行留一个
3.替换符合条件的文本

使用sed命令进行替换操作时需要用到的选项:s(字符串替换)、c(整行/整块替换)、y(字符转换)等命令选项。由于测试文件不符合要求,以下就不截图了。

[[email protected] ~]# sed ‘s/the/THE/‘ test.txt
//将每行中的第一个the替换为THE
[[email protected] ~]# sed ‘s/l/L/2‘ test.txt
//将每行中的第三个“l”替换为“L”
[[email protected] ~]# sed ‘s/the/THE/g‘ test.txt
//将文件中所有的“the”替换为“THE”
[[email protected] ~]# sed ‘s/o//g‘ test.txt
//将文件中所有的“o”删除
[[email protected] ~]# sed ‘s/^/#/‘ test.txt
//在每行的行首插入“#”号
[[email protected] ~]# sed ‘/the/s/^/#/‘ test.txt
//在包含“the”的每行行首插入“#”号
[[email protected] ~]# sed ‘s/$/EOF/‘ test.txt
//在每行行尾插入字符串“EOF”
[[email protected] ~]# sed ‘3,5s/the/THE/g‘ test.txt
//将第3~5行中的所有“the”替换为“THE”
[[email protected] ~]# sed ‘/the/s/o/O/g‘ test.txt
//将包含“the”的所有行中的o替换为“O”
4.迁移符合条件的文本

使用sed命令进行迁移文本操作时需要用到的选项有:g、G将剪贴板中的数据覆盖/追加到指定行;w保存为文件;r读取指定文件;a追加指定内容。

[[email protected] ~]# sed ‘/the/{H;d};$G‘ test.txt
//将包含“the”的行迁移到文件末尾,“;”用于多个操作
[[email protected] ~]# sed ‘1,5{H;d};17G‘ test.txt
//将第1~5行的内容转移到第17行后
[[email protected] ~]# sed ‘/the/w out.file‘ test.txt
//将包含“the”的行另存为文件out.file
[[email protected] ~]# sed ‘/the/r /etc/hostname‘ test.txt
//将文件/etc/hostname的内容添加到包含“the”的每行以后
[[email protected] ~]# sed ‘3aNEW‘ test.txt
//在第3行后面插入一个新行,内容为“NEW”
[[email protected] ~]# sed ‘/the/aNEW‘ test.txt
//在包含“the”的每行后插入一个新行,内容为“NEW”
[[email protected] ~]# sed ‘3aNEW1\nNEW2‘ test.txt
//在第3行后面多行内容,中间的“\n”表示换行
5.使用脚本编辑文件

使用sed脚本,将编辑指令存放到文件中(每行一条标记指令),通过“-f”选项来调用。

[[email protected] ~]# sed ‘1,5{H;d};17G‘ test.txt
//将第1~5行内容转移至第17行后


以上操作转换为脚本文件方式:

[[email protected] ~]# vim 1.list
1,5H
1,5d
17G
[[email protected] ~]# sed -f 1.list test.txt

6.sed直接操作文件示例

编写一个脚本,用来调整vsftpd服务配置:禁止匿名用户,但允许本地用户(也允许写入)登录。

[[email protected] ~]# vim local_only_ftp.sh
#!/bin/bash
S="/usr/share/doc/vsftpd-3.0.2/EXAMPLE/INSERNET_SITE/vsftpd.conf"
C="/etc/vsftpd/vsftpd.conf"
#指定样本文件路径、配置文件路径
[ ! -e "$C.bak" ] && cp $C $C.bak
#备份原来的配置文件,检测(配置文件.bak)是否存在,如果不存在则使用cp命令复制
sed -e ‘/^anonymous_enable/s/YES/NO/g‘ $S > $C
sed -i -e ‘/^local_enable/s/NO/YES/g‘ -e ‘/^write_enable/s/NO/YES/g‘ $C
grep "listen" $C || sed -i ‘$alisten=YES‘ $A
#基于样本配置进行调整,覆盖现有文件
systemctl restart vsftpd
systemctl enable vsftpd
#重启ftp服务,并设置为开机自启动

awk命令工具

在Linux/UNIX系统中,awk是一个功能强大的编辑工具,逐行读取输入文本,并根据指定的匹配模式进行查找,对符合条件的内容进行格式化输出或者过滤处理,可以在无交互的情况下实现相当复杂的文本操作,被广泛应用于Shell脚本,完成各种自动化配置任务。

1.awk命令的语法及概述
awk 选项  ‘模式或条件 { 编辑指令 }‘ 文件1 文件2 …
//过滤并输出文件符合条件的内容
awk  -f  脚本文件 文件1 文件2 …
//从脚本中调用编辑指令,过滤并输出内容

*awk执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”和“||”;
也可以进行简单的数学运算,如+ 、-、
、/、%、^分别表示加、减、乘、除、取余、乘方。**

awk从输入文件或者标准输入中读入信息,与sed一样,信息的读入也是逐行读取的。不同的是,awk命令将文本文件中的一行视为一个记录,而将一行中的某一部分(列)作为记录的一个字段。为了操作这些不同的字段(列),awk借用shell中类似于位置变量的方法,用$1、$2…$9顺序的表示不同列,$0表示整行。不同字段与不同字段可以通过指定的方式进行分隔,awk默认的分隔符是空格。awk命令允许使用“-F分隔符”的形式来指定分隔符。

awk命令对/etc/passwd文件的处理过程如图:

awk包含几个特殊的内建变量,如:

2.awk命令用法示例
1)按行输出文本
[[email protected] ~]# awk ‘{print}‘ test.txt
//输出所有内容,等同于“cat test.txt”
[[email protected] ~]# awk ‘{print $0}‘ test.txt
//输出所有内容,等同于“cat test.txt”
[[email protected] ~]# awk ‘NR==1,NR==3{print}‘ test.txt
//输出第1~3行的内容
[[email protected] ~]# awk ‘(NR>=1) && (NR<=3) {print}‘ test.txt
//输出第1~3行的内容
[[email protected] ~]# awk ‘NR==1 || NR==3{print}‘ test.txt
//输出第1行、第3行的内容
[[email protected] ~]# awk ‘(NR%2)==1 {print}‘ test.txt
//输出所有奇数行的内容
[[email protected] ~]# awk ‘(NR%2)==0 {print}‘ test.txt
//输出所有偶数行的内容
[[email protected] ~]# awk ‘/^root/{print}‘ /etc/passwd
//输出以“root”开头的行
[[email protected] ~]# awk ‘/nologin$/{print}‘ /etc/passwd
//输出以“nologin”结尾的行
[[email protected] ~]# awk ‘BEGIN {x=0} ;/\/bin\/bash$/{x++};END {print x}‘ /etc/passwd
//统计以/bin/bash结尾的行数
[[email protected] ~]# grep -c "/bin/bash$" /etc/passwd
//统计以/bin/bash结尾的行数
[[email protected] ~]# awk ‘BEGIN{RS=""}; END{print NR}‘ /etc/squid/squid.conf
//统计以空格分隔的文件段落数

注意:命令较多时,使用“BEGIN……END”

2)按字段输出文本
[[email protected] ~]# awk ‘{print $3}‘ test.txt
//输出每行中(以空格分隔)的第3个字段
[[email protected] ~]# awk ‘{print $1,$3}‘ test.txt
//输出每行中(以空格分隔)的第1个和第3个字段
[[email protected] ~]# awk -F ":" ‘$2==""{print}‘ /etc/shadow
//输出/etc/shadow文件中(以“:”分隔)的第二个字段(密码为空的用户)
[[email protected] ~]# awk ‘BEGIN {FS=":"}; $2=""{print}‘ /etc/shadow
//输出/etc/shadow文件中(以“:”分隔)的第二个字段(密码为空的用户)
[[email protected] ~]# awk -F ":" ‘$7~"/bash"{print $1}‘ /etc/passwd
//输出以“:”分隔且第7个字段中包含“/bash”的行的第1个字段
[[email protected] ~]# awk ‘($1~"nfs") && (NF==8) {print $1,$2}‘ /etc/services
//输出包含8个字段且第1个字段中包含“nfs”的行的第1、2个字段
[[email protected] ~]# awk -F ":" ‘($7!="/bin/bash") && ($7!="/sbin/nologin") {print}‘ /etc/passwd
//输出第7个字段既不为“/bin/bash”也不为“/bin/nologin”的所有行
3)通过管道,双引号调用Shell命令

[[email protected] ~]# awk -F: ‘/bash$/{print | "wc -l"}‘ /etc/passwd
//调用“wc -l”命令统计使用“bash”的用户个数
[[email protected] ~]# grep -c "bash$" /etc/passwd
//同上一条命令一样的作用
[[email protected] ~]# awk ‘BEGIN {while ("w" | getline) n++ ; {print n-2}}‘
//调用“w”命令,并用力啊统计在线用户数
[[email protected] ~]# awk ‘BEGIN { "hostname" | getline ; print $0}‘
//调用“hostname”命令,并输出当前用户名

4)使用awk命令进行简单的数学运算
[[email protected] ~]# awk ‘BEGIN{ a=6;b=3;print"(a + b)=",(a + b)}‘
(a + b)= 9
[[email protected] ~]# awk ‘BEGIN{ a=6;b=3;print"(a - b)=",(a - b)}‘
(a - b)= 3
[[email protected] ~]# awk ‘BEGIN{ a=6;b=3;print"(a / b)=",(a / b)}‘
(a / b)= 2
[[email protected] ~]# awk ‘BEGIN{ a=6;b=3;print"(a % b)=",(a % b)}‘
(a % b)= 0

更加详细的awk命令,可以参考博文:awk学习

原文地址:https://blog.51cto.com/14157628/2426185

时间: 2024-08-26 01:10:13

Shell编程三剑客详解的相关文章

shell编程 sed详解

1,作用和工作原理: 作用:处理文件内容(增删改查),学了sed之后可以对较大的文件或者大批量的文件进行高效率的处理. 工作原理:sed读取一行,首先将这行放入缓存,然后才对这行进行处理,处理完后,将缓存区的内容发送到终端,其中sed对应的缓存区空间称为:模式空间. 2,格式: sed [选项] [sed命令] [输入文件] 注意事项: 1,他们之间都有空格,每个元素至少一个空格 2,sed命令是sed软件的内置命令选项(称为sed命令选项是为了和前面的选项区分),它可以是单个也可以是多个sed

PHP Socket 编程过程详解

PHP Socket 编程过程详解 Socket用于进程间通信.进程间通信通常基于客户端—服务端模型.此时,客户端—服务端是可以彼此交互的应用程序.客户端和服务端之间的交互需要连接.Socket编程负责的就是为应用程序之间建立可进行交互的连接. 在本文中,我们将学习如何用PHP创建一个简单的客户端—服务端.我们还将学习如何客户端应用程序如何发送消息到服务端,以及如何从服务端接受消息. 使用代码 目的:开发一个客户端用于发送string消息到服务端,服务端将相同的信息反转后返回给客户端. PHP服

CUDA C 编程指导(二):CUDA编程模型详解

CUDA编程模型详解 本文以vectorAdd为例,通过描述C在CUDA中的使用(vectorAdd这个例子可以在CUDA sample中找到.)来介绍CUDA编程模型的主要概念.CUDA C的进一步描述可以参考<Programming Interface>. 主要内容包括: 1.Kernels(核函数) 2.Thread Hierarchy(线程结构) 3.Memory Hierarchy(存储结构) 4.Heterogeneous Programming(异构编程) 5.Compute C

Linux Shell系列教程之(八)Shell printf命令详解

本文是Linux Shell系列教程的第(八)篇,更多shell教程请看:Linux Shell系列教程 在上一篇:Linux Shell系列教程之(七)Shell输出这篇文章中,已经对Shell printf命令有了一个简略的介绍,本篇给大家详细介绍下Shell中的printf命令. 一.Shell printf命令语法 printf format-string [arguments...] format-string为描述格式规格的字符串,用来描述输出的排列方式,最好为此字符串加上引号.此字

《Java网络编程核心技术详解》赶稿中......

<精通JPA与Hibernate:Java对象持久化技术详解>这本书写完,就开始着手写<Java网络编程核心技术详解>一书,已经写了一大半,内容包括:Java网络编程的基础知识. 套接字编程.非阻塞通信.创建HTTP服务器与客户程序.数据报通信.对象的序列化与反序列化.Java反射机制.RMI框架.JDBC API.JavaMail API.MVC设计模式.XML处理.安全网络通信.CORBA和Web服务. 每写一章,都会遇到一些挑战,主要是在调试程序时,没有出现预期的结果.例如分

好消息:《Java网络编程核心技术详解》出版

2019年5月从美国回到上海,由于一切都不安定,先在旅馆里宅了4个多月,写完<精通JPA与Hibernate:Java对象持久化技术详解>,就开始写这本书.现在,正是新冠病毒疫情还没结束之际,本书克服种种困难,如期和读者见面了. 我们一不小心,就会被一种潜在的观念暗示:只要忙过了这一阵,将来就能过上高枕无忧的生活.实际上,生活中总是有各种意外的事情发生,小到个人家庭的琐事,大到国家社会的暂时的不安定.为了能随遇而安,就得常常給自己洗脑,不要以为忙过了这一阵,就会有永远太平安宁的出头之日. 戒骄

awk.sed.grep三剑客详解

事前准备1.主机node1:172.16.133.112.作为实验的文件/etc/passwd /etc/fstab qinqin cp /etc/passwd . cp /etc/fstab . 一.grep用法详解1.grep是干什么的grep的全名是Galobal research Regular Expression and Pringtiong,即搜索正则表达式,也就是说grep简单来讲就是用来搜索匹配字符的2.grep分类grep有基本正则表达式和扩展正则表达式之分,不过她们的作用域

转 shell awk 使用详解

awk简介 awk: 中文意思是报告生成器 能够根据我们输入的信息,将信息格式化以后显示,将定义好的信息以比较美观(直观)的方式显示出来出现比较早,继而出现了new awk(nawk)在windows上实现,gawk, awk实现在linux上.awk是一种编程语言,用于在linux/unix下对文本和数据进行处理.数据可以来自标准输入.一个或多个文件,或其它命令的输出.它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具.它在命令行中使用,但更多是作为脚本

Shell变量基础详解

一.变量简介 变量是暂时存储数据的地方及数据标记,所存储的数据存在于内存空间中,通过正确地调用内存空间中变量的名字就可以取出与变量对应的数据.使用变量的最大好处就是使程序开发更为方便,当然,在编程中使用变量也是必须的.否则就很难完成相关的工作. 变量赋值的方式:先写变量名称,紧接着就是"=",最后是值."="号前后不允许有空格.一般情况下,定义变量时,需要给变量的值带双引号,以防止出错,特别是当值的内容中有空格时,必须带双引号. 二.变量的类型 变量可分为两大类: