shell脚本正则表达式三剑客之一（grep,egrep）

Shell脚本之正则表达式

一.正则表达式三剑客之一：grep

1.学习正则表达式前我们拿一个无用的配置文件作为测试练习

[[email protected] ~]# vim chen.txt

#version=DEVEL
 System authorization information
auth --enableshadow --passalgo=sha512# Use CDROM installation media
cdrom
thethethe
THE
THEASDHAS
 Use graphical install
graphical
 Run the Setup Agent on first boot
firstboot --enable
ignoredisk --only-use=sda
wood
wd
wod
woooooooood
124153
3234
342222222
faasd11
2
ZASASDNA
short
shirt

2.查找特定字符

“-vn” 反向选择。查找不包含“the”字符的行，则需要通过 grep 命令的“-vn”选项实现。
-n“ 表示显示行号
“-i” 表示不区分大小写
命令执行后，符合匹配标准的字符，字体颜色会变为红色

[[email protected] ~]# grep -n ‘the‘ chen.txt
6:thethethe
11:# Run the Setup Agent on first boot
[[email protected] ~]# grep -in ‘the‘ chen.txt
6:thethethe
7:THE
8:THEASDHAS
11:# Run the Setup Agent on first boot
[[email protected] ~]# grep -vn ‘the‘ chen.txt
1:#version=DEVEL
2:# System authorization information
3:auth --enableshadow --passalgo=sha512
4:# Use CDROM installation media
5:cdrom
7:THE
8:THEASDHAS
9:# Use graphical install
10:graphical
12:firstboot --enable
13:ignoredisk --only-use=sda
14:wood
15:wd
16:wod
17:woooooooood
18:124153
19:3234
20:342222222
21:faasd11
22:2
23:ZASASDNA
24:
short
shirt

3.括号"[ ]"来查找集合字符
想要查找“shirt”与“short”这两个字符串时，可以发现这两个字符串均包含“sh” 与“rt”。此时执行以下命令即可同时查找到“shirt”与“short”这两个字符串。“[]”中无论有几个字符，都仅代表一个字符，也就是说“[io]”表示匹配“i”或者“o”。

[[email protected] ~]# grep -n ‘sh[io]rt‘ chen.txt  //过滤short或shirt中都有io集合字符
24:short
25:shirt

若要查找包含重复单个字符“oo”时，只需要执行以下命令即可。

[[email protected] ~]# grep -n ‘oo‘ chen.txt
11:# Run the Setup Agent on first boot
12:firstboot --enable
14:wood
17:woooooooood

若查找“oo”前面不是“w”的字符串，只需要通过集合字符的反向选择“[^]”来实现该目的，如执行“grep –n‘[^w]oo’test.txt”命令表示在 test.txt 文本中查找“oo” 前面不是“w”的字符串

[[email protected] ~]# grep -n ‘[^w]oo‘ chen.txt //过滤w开头oo的字符串
11:# Run the Setup Agent on first boot
12:firstboot --enable
17:woooooooood

在上述命令的执行结果中发现“woood”与“wooooood”也符合匹配规则，二者均包含“w”。其实通过执行结果就可以看出，符合匹配标准的字符加粗显示，而上述结果中可以得知，“#woood #”中加粗显示的是“ooo”，而“oo”前面的“o”是符合匹配规则的。同理 “#woooooood #”也符合匹配规则。
若不希望“oo”前面存在小写字母，可以使用“grep –n‘[^a-z]oo’test.txt”命令实现，其中“a-z”表示小写字母，大写字母则通过“A-Z”表示。

[[email protected] ~]# grep -n ‘[^a-z]oo‘ chen.txt
19:Foofddd

查找包含数字的行可以通过“grep –n‘[0-9]’test.txt”命令来实现

[[email protected] ~]# grep -n ‘[0-9]‘ chen.txt
3:auth --enableshadow --passalgo=sha512
20:124153
21:3234
22:342222222
23:faasd11
24:2

查找行首“^”与行尾字符“$”

[[email protected] ~]# grep -n ‘^the‘ chen.txt
6:thethethe

查询以小写字母开头的行可以通过“1”规则来过滤，

[[email protected] ~]# grep -n ‘^[a-z]‘ chen.txt
3:auth --enableshadow --passalgo=sha512
5:cdrom
6:thethethe
10:graphical
12:firstboot --enable
13:ignoredisk --only-use=sda
14:wood
15:wd
16:wod
17:woooooooood
18:dfsjdjoooooof
23:faasd11
26:short
27:shirt

查询大写字母开头

[[email protected] ~]# grep -n ‘^[A-Z]‘ chen.txt
7:THE
8:THEASDHAS
19:Foofddd
25:ZASASDNA

若查询不以字母开头的行则使用“[a-zA-Z]”规则。

[[email protected] ~]# grep -n ‘^[^a-zA-Z]‘ chen.txt
1:#version=DEVEL
2:# System authorization information
4:# Use CDROM installation media
9:# Use graphical install
11:# Run the Setup Agent on first boot
20:124153
21:3234
22:342222222
24:2

“^”符号在元字符集合“[]”符号内外的作用是不一样的，在“[]”符号内表示反向选择，在“[]”符号外则代表定位行首。反之，若想查找以某一特定字符结尾的行则可以使用“$”定位符。例如，执行以下命令即可实现查询以小数点（.）结尾的行。因为小数点（.）在正则表达式中也是一个元字符（后面会讲到），所以在这里需要用转义字符“\”将具有特殊意义的字符转化成普通字符。

[[email protected] ~]# grep -n ‘\.$‘ chen.txt
5:cdrom.
6:thethethe.
9:# Use graphical install.
10:graphical.
11:# Run the Setup Agent on first boot.

当查询空白行时，执行“grep –n ‘^$’ chen.txt

查找任意一个字符“.”与重复字符“*”
在正则表达式中小数点（.）也是一个元字符，代表任意一个字符。例如，执行以下命令就可以查找“w??d”的字符串，即共有四个字符，以 w 开头 d 结尾。

[[email protected] ~]# grep -n ‘w..d‘ chen.txt
14:wood

在上述结果中，“wood”字符串“w…d”匹配规则。若想要查询 oo、ooo、ooooo 等资料，则需要使用星号（）元字符。但需要注意的是，“”代表的是重复零个或多个前面的单字符。“o”表示拥有零个（即为空字符）或大于等于一个“o”的字符，因为允许空字符，所以执行“grep –n‘o’test.txt”命令会将文本中所有的内容都输出打印。如果是“oo”，则第一个 o 必须存在，第二个 o 则是零个或多个 o，所以凡是包含 o、oo、ooo、ooo，等的资料都符合标准。同理，若查询包含至少两个 o 以上的字符串，则执行“grep –n‘ooo’ test.txt”命令即可。

[[email protected] ~]# grep -n ‘ooo*‘ chen.txt
11:# Run the Setup Agent on first boot.
12:firstboot --enable
14:wood
17:woooooooood
18:dfsjdjoooooof
19:Foofddd

查询以 w 开头 d 结尾，中间包含至少一个 o 的字符串，执行以下命令即可实现。

[[email protected] ~]# grep -n ‘woo*d‘ chen.txt
14:wood
16:wod
17:woooooooood

查询以 w 开头 d 结尾，中间的字符可有可无的字符串。

[[email protected] ~]# grep -n ‘w.*d‘ chen.txt
14:wood
15:wd
16:wod
17:woooooooood

查询任意数字所在行。

[[email protected] ~]# grep -n ‘[0-9][0-9]*‘ chen.txt
3:auth --enableshadow --passalgo=sha512
20:124153
21:3234
22:342222222
23:faasd11
24:2

查找连续字符范围“{}”
使用“.”与“*”来设定零个到无限多个重复的字符，如果想要限制一个范围内的重复的字符串该如何实现呢？例如，查找三到五个 o 的连续字符，这个时候就需要使用基础正则表达式中的限定范围的字符“{}”。因为“{}”在 Shell 中具有特殊意义，所以在使用“{}”字符时，需要利用转义字符“\”，将“{}”字符转换成普通字符。

查询两个 o 以上的字符

[[email protected] ~]# grep -n ‘o\{2\}‘ chen.txt
11:# Run the Setup Agent on first boot.
12:firstboot --enable
14:wood
17:woooooooood
18:dfsjdjoooooof
19:Foofddd

查询以 w 开头以 d 结尾，中间包含 2～5 个 o 的字符串。

[[email protected] ~]# grep -n ‘wo\{2,5\}d‘ chen.txt
14:wood

查询以 w 开头以 d 结尾，中间包含 2 以上 o 的字符串。

[[email protected] ~]# grep -n ‘wo\{2,\}d‘ chen.txt
14:wood
17:woooooooood

二.扩展正则表达式

为了简化整个指令，需要使用范围更广的扩展正则表达式。例如，使用基础正则表达式查询除文件中空白行与行首为“#” 之外的行（通常用于查看生效的配置文件），执行“grep –v‘^KaTeX parse error: Expected group after ‘^‘ at position 22: …txt | grep –v ‘^?#’”即可实现。这里需要使用管…|^#’test.txt”，其中，单引号内的管道符号表示或者（or）。
此外，grep 命令仅支持基础正则表达式，如果使用扩展正则表达式，需要使用 egrep 或 awk 命令。awk 命令在后面的小节进行讲解，这里我们直接使用 egrep 命令。egrep 命令与 grep 命令的用法基本相似。egrep 命令是一个搜索文件获得模式，使用该命令可以搜索文件中的任意字符串和符号，也可以搜索一个或多个文件的字符串，一个提示符可以是单个字符、一个字符串、一个字或一个句子。
常见的扩展正则表达式的元字符主要包括以下几个：

"+“示例：执行“egrep -n ‘wo+d’ test.txt”命令，即可查询"wood” “woood” "woooooood"等字符串

[[email protected] ~]# egrep -n ‘wo+d‘ chen.txt
14:wood
16:wod
17:woooooooood

"?"示例：执行“egrep -n ‘bes?t’ test.txt”命令，即可查询“bet”“best”这两个字符串

[[email protected] ~]# egrep -n ‘bes?t‘ chen.txt
11:best
12:bet

"|"示例：执行“egrep -n ‘of|is|on’ test.txt”命令即可查询"of"或者"if"或者"on"字符串

[[email protected] ~]# egrep -n ‘of|is|on‘ chen.txt
1:#version=DEVEL
2:# System authorization information
4:# Use CDROM installation media
13:# Run the Setup Agent on first boot.
15:ignoredisk --only-use=sda
20:dfsjdjoooooof
21:Foofddd

"()"示例：“egrep -n ‘t(a|e)st’ test.txt”。“tast”与“test”因为这两个单词的“t”与“st”是重复的，所以将“a”与“e”列于“()”符号当中，并以“|”分隔，即可查询"tast"或者"test"字符串

[[email protected] ~]# egrep -n ‘t(a|e)st‘ chen.txt
12:test
13:tast

"()+“示例：“egrep -n ‘A(xyz)+C’ test.txt”。该命令是查询开头的"A"结尾是"C”，中间有一个以上的 "xyz"字符串的意思

[[email protected] ~]# egrep -n ‘A(xyz)+C‘ chen.txt
14:AxyzxyzxyzC

原文地址：https://blog.51cto.com/14449524/2441674

时间： 2024-10-31 13:06:13

shell脚本正则表达式三剑客之一（grep,egrep）的相关文章

Linux 文本处理三剑客之grep   egrep

Linux 文本处理三剑客之grep egrep grep: Global search REgular expression andPrint out the line. 作用:文本搜索工具,根据用户指定的"模式(pattern)"逐行去搜索目标文本,打印匹配到的行. 模式:由正则表达式的元字符及文本字符所编写的过元字符,其中正则表达示分基本正则表达式,和扩展正则正则表达式2类元字符不表示其字面意义,而用于表示通配或控制功能滤条件.元字符有下面一些字符匹配: .:匹配任意单个

Shell脚本正则表达式之——grep、egrep、sed（内含多个Demo）

Grep命令基本正则表达式实例之查找特定字符: 这里我们就以存放本机所有用户的/etc/passwd文件做实例 Demo1: [[email protected] ~]# grep -n "root" /etc/passwd //-n表示显示行号 1:root:x:0:0:root:/root:/bin/bash 10:operator:x:11:0:operator:/root:/sbin/nologin 基本正则表达式实例之查找集合字符: 有重复的字符时,可使用"[ ]

Shell脚本——正则表达式(一)

正则表达式的概念正则表达式:使用单个字符串来描述.匹配一系列符合某个句法规则的字符串由普通字符与特殊字符组成,一般用在脚本编程.文本编辑器中,如php.python.she等,简写为regex.regexp. 用来检索.替换符合模式的文本,具有强大的文本匹配功能能够在文本海洋中快速高效地处理本文基础正则表达式正则表达式的字符串表达方法根据不同的严谨程度与功能分为基本正则表达式与扩展正则表达式.基础正则表达式是常用的正则表达式的最基础的部分.在 Linux 系统中常见的文件处理工具中 gre

Shell脚本——正则表达式

shell 脚本-正则表达式

字符类 (Character Class):如上例的x 和y,它们在模式中表示一个字符 ,但是取值范围是一类字符中的任意一个. 数量限定符 (Quantifier): 邮件地址的每一部分可以有一个或多个 x字符 ,IP地址的每一部分可以有 1-3个y 字符位置限定符 (Anchor):描述各种字符类以及普通字符之间的位置关系,例如邮件地址分三部分,用普通字符 @和 .隔开 ,IP地址分四部分 ,用 .隔开 ,每一部分都可以用字符类和数量限定符描述.为了表示位置关系 ,需要位置限定

shell脚本学习笔记之grep命令用法

***grep基本用法 grep [选项] [模式] [文件..] 选项 -c 只输出匹配行的数量 -i 搜索时忽略大小写 -h 查询多文件时不显示文件名 -l 只搜索匹配的文件名,而不列出具体的匹配行 -n 列出所有的匹配行,并显示行号 -s 不显示不存在或无匹配文本的错误信息 -v 显示不包含匹配文本的所有行 -w 匹配整词 -x 匹配整行 -r 递归搜索,不仅所属当前工作目录,而且搜索子目录 -q 禁止储存任何结果,以推迟状态表示所属是否成功 -b 打印匹配行距文件的头部的偏移量,以字节为

shell脚本编程中的grep命令

grep命令语法 grep命令使用一个选项.一个要匹配的模式和要搜索的文件,它的语法如下所示: grep [options] PATTERN [FILES] 如果没有提供文件名,则grep命令将搜索标准输入. options 选项含义 -c 输出匹配行的数目,而不是输出匹配的行 -E 启用扩展表达式 -h 取消每个输出行的普通前缀,即匹配查询模式的文件名 -i 忽略大小写 -l 只列出包含匹配行的文件名,而不输出真正的匹配行 -v 对匹配模式取反,即搜索不匹配行而

shell下正则表达式与其工具grep

一.grep相关知识 1.grep grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. 2.grep工作原理 grep有两种模式:Basic和Extend模式. 在Basic模式下,命令直接grep ,其中的?.+.{}.|.()都被解释为普通字符,如果要使用其的特殊意义,就必须

Shell 编程正则表达式

本篇主要写一些shell脚本正则表达式的使用基础. 概述正则表达式分为基础正则表达式(Regular Expression)与扩展正则表达式(Extended Regular Expression). 它不是一个工具程序,而是一个字符串处理的标准依据,是使用单个字符串搜索.匹配一系列符合某个语法规则的字符串. 它由普通字符(a~z)以及特殊字符(元字符)组成. linux 文本处理工具文本处理工具基础正则表达式扩展正则表达式 vi编辑器支持 / grep 支持 / egrep 支持支