正则表达式 grep egrep

Linux 文本处理三剑客

grep : 文本过滤工具

sed：文本编辑器(以行为编辑对象单位) stream editor

awk：文本报告生成器； linux上awk的实现为gawk

grep：Global search REgular Expression and Print out the line

作用：文本搜索工具，根据用户指定的“模式(pattern)”逐行去搜索目标文本，打印匹配到的行。

模式：由正则表达式的元字符及文本字符所编写的过滤条件；

元字符：字符不表示其字面意义，而用于表示通配或控制功能

正则表达式分为两类：

基本正则表达式 BRE

扩展正则表达式 ERE

grep命令：

语法： grep [OPTIONS] PATTERN [FILE...]

参数：

--color=auto：对匹配到的字符串高亮显示

-i：忽略大小写

-n：输出行号

-v：反向选择，显示没有‘搜索字符串’的行

-o：仅显示能够被模式匹配到的字符串本身

-q：静默模式

-E：使用扩展的正则表达式

基本正则表达式的元字符：

字符匹配：

.：匹配任意单个字符；

[]: 匹配指定范围内的任意单个字符

[^]: 匹配指定范围外的任意单个字符，^在[]中代表反向选择

特殊符号
[:alnum:]	代表英文大小写字符及数字，0-9，A-Z，a-z
[:alpha:]	代表任何英文小写字符 a-z
[:blank:]	空格键与[Tab]键
[:cntrl:]	键盘上的控制按键，CR，LF，Tab，Del
[:digit:]	数字 0-9
[:lower:]	小写字符 a-z
[:upper:]	大写字符 A-Z
[:punct:]	代表标点符号 “ ’ ? ! ；：$#

次数匹配：用于指定其次数的字符的后面

*: 重复0次或多次前一个字符

\?: 重复0次或1次前一个字符

\+: 重复1次或多次前一个字符

\{m\} : 连续重复m次前一个字符

\{m,n\}: 重复m到n个前一个字符 [m,n]

\{0,n\}: 重复至多n次前一个字符

\{m,\}: 重复至少m次前一个字符

.*: 匹配任意长度的任意字符

位置锚定：

^word: 行首锚定，待查找字符串word在行首

word$: 行尾锚定，待查找字符串word在行尾

\<，\b: 词首锚定，待查找单词的左侧

\>，\b：词尾锚定，待查找单词的右侧

分组：

分组的小括号中的模式匹配到的内容，会在执行过程中被正则表达式引擎记录下来，并保存内置的变量中，这些变量分别是\1, \2 …

后向引用: 使用变量引用前面的分组括号中的模式所匹配到的字符。

示例：

#显示重复0次或多次前一个字符(可以是0次，所以只有字母b也符合)
[[email protected] test]# grep ‘a*b‘ test_grep 
aabbccdd
343kkkbord

#重复0次或1次前一个字符
[[email protected] test]# grep ‘a\?b‘ test_grep 
aabbccdd
aaabcd
abcde
343kkkbord

# 重复1次或多次前一个字符
[[email protected] test]# grep ‘a\+b‘ test_grep 
aabbccdd
aaabcd
abcde

# 连续重复2次前一个字符
[[email protected] test]# grep ‘a\{2\}b‘ test_grep 
aabbccdd
aaabcd   #此行符合重复2次a  aab

#\{0,n\}: 重复至多n次前一个字符
[[email protected] test]$ grep ‘a\{0,2\}b‘ test_grep 
aaabc
aabbcc
abababab
abcabcabc
bcdef

#匹配行首是aaa的行
[[email protected] test]$ grep ‘^aaa‘ test_grep 
aaabc

#匹配行尾是bab结束的行
[[email protected] test]$ grep ‘bab$‘ test_grep 
Abababab

#查找单词are所在的行
[[email protected] test]$ grep ‘\bare\b‘ test_grep 
how are you?
how old are you?
where are you from?

#分组的使用
[[email protected] test]$ grep ‘\(aba\).*\1‘ test_grep 
aba666abab #结尾的b是不会被匹配到的

扩展正则表达式：

简化命令操作，支持查找模式内管道命令，元字符不用转义字符

grep家庭有三个命令

grep ：基本正则表达式

-e :扩展正则表达式

-f :不支持正则表达式

egrep 扩展正则表达式

fgrep 不支持正则表达式

扩展正则表达式的元字符

字符匹配：

.：匹配任意单个字符；

[]: 匹配指定范围内的任意单个字符

[^]: 匹配指定范围外的任意单个字符，^在[]中代表反向选择

次数匹配：

*: 重复0次或多次前一个字符

?: 重复0次或1次前一个字符

+: 重复1次或多次前一个字符

{m} : 连续重复m次前一个字符

{m,n}: 重复m到n个前一个字符 [m,n]

.*: 匹配任意长度的任意字符

位置锚定：

^word: 行首锚定，待查找字符串word在行首

word$: 行尾锚定，待查找字符串word在行尾

\<，\b: 词首锚定，待查找单词的左侧

\>，\b：词尾锚定，待查找单词的右侧

分组：()

后向引用：\1, \2, ...

模式中应用管道命令

a|b

C|cat：不表示Cat或cat，而表示C或cat；

要写成(C|c)at

egrep ‘a|b‘ test.txt

练习：
1、显示/etc/passwd文件中以bash结尾的行；

   [email protected] test]$ grep ‘bash$‘ /etc/passwd
   root:x:0:0:root:/root:/bin/bash
   roger:x:500:500:Roger.Wang:/home/roger:/bin/bash

2、显示/etc/passwd文件中的两位数或三位数；

[[email protected] test]$  grep ‘\<[0-9]\{2,3\}\>‘ /etc/passwd
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
.....
gdm:x:42:42:gdm system account:/var/lib/gdm:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
roger:x:500:

3、显示‘netstat -tan‘命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行；

[[email protected] test]$ netstat -tan | grep ‘LISTEN *‘
tcp        0      0 0.0.0.0:1445                0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:902                 0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:139                 0.0.0.0:*                   LISTEN      
tcp        0      0 127.0.0.1:52719             0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:111                 0.0.0.0:*                   LISTEN      
tcp        0      0 127.0.0.1:8979              0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:48500               0.0.0.0:*                   LISTEN      
tcp        0      0 127.0.0.1:59669             0.0.0.0:*                   LISTEN      
.......

4、添加用户bash，testbash, basher以及nologin用户(nologin用户的shell为/sbin/nologin)；而后找出/etc/passwd文件中用户名同shell名的行；

  
  #  grep ‘\(^\<.*\>\).*\1$‘ /etc/passwd

5、显示当前系统上root、centos或user1用户的默认的shell和UID；

  
  # egrep ‘^(root|centos|user1)‘ /etc/passwd | cut -d ‘:‘ -f 1,3,7

6、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行；

  
  # egrep ‘\b\w+\b.*\(.*\)‘ /etc/rc.d/init.d/functions

7、使用echo输出一个路径，而后egrep找出其路径基名；进一步地：使用egrep取出其目录名；

处理的不合适，有待继续研究

  #路径基名 basename ：
  # echo /home/roger/test | egrep -o ‘[^/]*$‘
  #目录名 dirname ：
  #echo /home/roger/test | egrep -o ‘[/].*[/]‘

8、找出ifconfig命令执行结果中1-255之间的数字；

# ifconfig | egrep ‘\b[1-9]\b|\b[1-9][0-9]\b|\b1[0-9][0-9]\b|\b2[0-4][0-9]\b|\b25[0-5]\b‘

如有错误，敬请指正！

谢谢！

时间： 2024-10-10 00:55:07

正则表达式 grep egrep的相关文章

Linux学习之正则表达式&grep&egrep

我们经常需要在文档中搜索符合自己要求的内容,这些部分可能分散在文档的各个位置,各个角落.可以利用关键字例如/keyword或者?keyword一个一个的搜索,还有我可能不止想搜索关键字,而是指定一个范围,怎样操作?而且怎样把这些搜索到的内容集中地显示出来?使用正则表达式搜索字串的grep命令和egrep命令就可以满足我们的这个要求. 正则表达式(Regular Expression)是一种字符书写的模式,以行为单位进行字符的处理,透过一些特殊字符的辅助,利用这种模式可以轻易地达到对字符的搜索.删

通配符和正则表达式-grep,egrep,fgrep

通配符和正则表达式-grep,egrep,fgrep 通配符和正则表达式,通配符用于文件名匹配,命令支持ls,cp,rm等;正则为通用匹配,命令支持grep,awk,sed,vi,find等.文本过滤工具grep,egrep,fgrep 通配符 * 匹配零个或多个任意字符 ? 匹配单个任意字符 [] 匹配指定范围内的一个字符,[]括号中的字符间隔符可以省略,如,\=:等等.举例[1:2=3,5\7] = [12357],也推荐使用这种省略写法作为标准 ^ 取反,表示非.注意:非数字即包

五. 正则表达式grep, egrep, fgrep

grep,egrep,fgrep : print lines matching a pattern 1.grep : grep [options] PATTERN FILE... PATTERN由元字符和和普通字符组成 -i : --ignore-case , 忽略大小写 -o : --only-matching, 只显示所匹配到的字符,二不是整行 -n : --line-number, 输出所匹配行的行号 -v : --invert-match, 显示除匹配行外的所有行 -E : --exte

Linux中的正则表达式 grep egrep fgrep

正则表达式: REGEXP REGuler EXPression,使用元字符和其他字符串来描述.匹配一系列符合某个句法规则的字符串.默认尽可能长得匹配(贪婪模式). 元字符: .:匹配任意单个字符(文件名通配中?表示任意单个字符) []:匹配指定范围内的单个字符 [^]:匹配指定范围外的单个字符 [:space:]:空白字符 [:puntt:]:所有标点符号 [:upper:]:所有大写字母 [:lower:]:所有小写字母 [:alpha:]:所有大小写字母 [:digit:]:所有数字 [:

Linux正则表达式grep,egrep 及相应的正则表达式用法详解

一.正则表达式介绍: 所谓正则,又称正则表达式.正规表示法.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式使用单个字符串来描述.匹配一系列符合某个句法规则的字符串.在很多文本编辑器里,正则表达式通常被用来检索.替换那些符合某个模式的文本. 给定一个正则表达式和另一个字符串,我们可以达到如下的目的: 1. 给定的字符串是否符合正则表达式的过滤逻辑(称作"匹配"): 2. 可以通过正则表达式,从字符

linux下的grep,egrep及正则表达式

一, linux上常用的文本搜索工具,grep家族和正则表达式及介绍 linux上常用的文本搜索工具: grep(egrep,fgrep):文本搜索工具:基于"pattern"对给定文本进行搜索操作: sed:Stream EDitor,流编辑器,行编辑工具:文本编辑工具: awk:GNU awk,文本格式化工具:文本报告生成器: 正则表达式:由一类特殊字符及文本字符所编写的模式,其有些字符不表示其字面意义,而是用于表示控制或通配的功能: 一般分为两类: 基本正则表达式:BRE 扩

grep与正则表达式,grep、egrep和fgrep

grep用法详解:grep与正则表达式首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同!正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串.vim.grep.awk .sed 都支持正则表达式,也正是因为由于它们支持正则,才显得它们强大:1基础正则表达式grep 工具,以前介绍过.grep -[acinv] '搜索内容串' filename-a 以文本文件方式搜索-c 计算找到的符合行的次数-i 忽略大小写-n 顺便输出行号-v

Linux正则表达式grep与egrep

Linux正则表达式grep与egrep 正则表达式:它是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串.在很多文本编辑器或其他工具里,正则表达式通常被用来检索或替换那些符合某个模式的文本内容.其实正则表达式,只是一种思想,一种表示方法.只要我们使用的工具支持表示这种思想那么这个工具就可以处理正则表达式的字符串.常用的工具有grep, sed, awk,这三个都是针对文本的行才操作的. grep 过滤器语法: grep [-cinvABC] 'word' filenam

正则表达式grep、egrep、fgrep

日期: 2015年08月27日正则表达式: (RegularExpression,在代码中常简写为rex.regexp或RE) 正则表达式使用单个字符串来描述.匹配一系列符合某个句法规则的字符串.通常被用来检索.替换符合某个模式的文本. 正则表达式是指一类字符书写的模式(pattern)这些字符成为元字符,元字符不表示其字面意义,而用于表示通配或控制功能. 正则表达式包括两类:基本正则表达式,扩展正则表达式 grep命令只支持基本正则表达式: egrep支持扩展正则表达式("e" 表