llinux文本三剑客之grep、egrep及相应的正则表达式和用法

Linux文本三剑客之grep族以及相应的正则表达式

Grep族是什么?

Grep族是linux学习中搜索文本的重要工具,它基于使用正则表达式来快速简洁的搜索你想要查看的文本。是搜索文本的不二之选

什么时候及在哪里使用grep呢?

上面咱们说到了,grep是文本搜索工具,所以当我们要搜索文本,有搜索文本的需要时我们就可以是使用grep工具。

下面我们来谈谈如何使用grep族命令以及涉及到的正则表达式的内容

文本搜索工具:grep族:grep, egrep, fgrep

Linux上文本处理三剑客

grep, egrep, fgrep:文本搜索工具;基于”pattern“对给定文本进行搜索操作;

sed:Stream EDitor,流编辑器,行编辑工具;文本编辑工具;

awk:GNU awk,文本格式化工具;文本报告生成器;

egrepfgrep的命令只跟grep有很小不同。egrep和fgrep都是grep的扩展,支持更多的re元字符,fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。

正则表达式:Regular Expression, REGEX

由一类特殊字符及文本字符所编写的模式,其有些字符不表示其字面意义,而是用于表示控制或通配的功能;

分两类:

基本正则表达式:BRE

扩展正则表达式:ERE

正则表达式引擎:利用正则表达式模式分析给定文本的程序;

grep家族:

grep: Global search REgular expression and Print out the line. 支持使用基本正则表达式;

egrep:支持使用扩展正则表达式;

fgrep:不支持使用正则表达式;

grep命令:

作用:文本搜索工具,根据用户指定的”pattern(过滤条件)“对目标文本逐行进行匹配检查;打印出符合条件的行;

模式:由文本字符及正则表达式元字符所编写的过滤条件;

Grep命令的使用:

grep  [OPTIONS]  PATTERN  [FILE...]

常用选项:

--color=auto:对匹配到的文本着色后高亮显示;

-i:忽略字符大小写;

-o:仅显示匹配 到的文本自身;

-v, --invert-match:反向匹配;

-E:支持扩展的正则表达式;

-q, --quiet, --silient:静默模式,不输出任何信息;

在grep命令中正则表达式元字符代表大含义:

基本正则表达式元字符:

字符匹配:

.:匹配任意单个字符;

 任意匹配

[ ]:匹配范围内的任意单个字符;

匹配范围内的单个字符,只要包含即可,如红色字体

[^ ]:匹配范围外的任意单个字符;

不包括abc都属于范围之内,如红色字体

例如:[:digit:]数字,[:lower:]所有小写字母, [:upper:]所有大写字母, [:alpha:]所有的字母包括大小写, [:alnum:]字母和数字, [:space:]空白字符, [:blank:]空白字符, [:punct:]符号字符等,这里我就不一一说明了

注:可通过使用命令 ~]#man 7 glob 命令来查看更多的字符的含义

匹配次数:

使用方式:

用在要指定其出现的次数的字符后面,用限制其前面的字符要出现的  次数;默认工作于贪婪模式;

*:匹配前面的字符任意次(0,1或多次);

grep "x*y":

Xxxyabc    ,yabc    ,abcxy   ,abcy这些结果都符合

Eg:[[email protected] ~]# grep "a*p" /etc/passwd

结果如下:红色字体展现

.*:任意长度的任意字符;例子如上面“.”的例子

\+:匹配前面的字符至少1次;

grep "x\+y":

Xxxyabc  yabc(不符合)   abcxy    abcy(不符合)

Eg:

\?:匹配前面的0次或1次,即前面的字符可有可无;

grep "x\?y":

xxxyabc, yabc  ,abcxy  ,abcy都符合

eg:       注:此图只是未截出含有ap的行

\{m\}:其前面的字符出现m次,m为非负整数;

grep "x\{2\}y":

xxxyabc(符合) ,Yabc(不符合),  abcxy(不符合),  abcy(不符合)

Eg:如下红色字体

\{m,n\}:其前面的字符出现m次,m为非负整数;[m,n]

grep “x\{2,3\}y”

Eg:如下红色字体

\{0,n\}:至多n次;

\{m,\}:至少m次;

例子与上面的类同

   位置锚定

限制使用模式搜索文本,限制模式所匹配到的文本只能出现于目标文本的哪个位置;

^:行首锚定;用于模式的最左侧,^PATTERN

Eg:以apple开头的行被检测出来显示

$:行尾锚定;用于模式的最右侧,PATTERN$

Eg: 以bash结尾的行显示出来

^PATTERN$:要让PATTERN完全匹配一整行;

^$:空行;

^[[:space:]]*$:

例子与上面雷同

单词:由非特殊字符组成的连续字符(字符串)都称为单词;

\<或\b:词首锚定,用于单词模式的左侧,格式为\<PATTERN, \bPATTERN

eg:如下红色字体

\>或\b:词尾锚定,用于单词模式的右侧,格式为PATTERN\>, PATTERN\b

\<PATTERN\>:单词锚定;

eg:

练习:

1、显示/etc/passwd文件中不以apple开头但不以bash结尾的行;

2、找出/etc/passwd文件中的三位或四位数;

~]# grep "\<[0-9]\{3,4\}\>" /etc/passwd

3、找出/etc/grub2.cfg文件中,以至少一个空白字符开头,后面又跟了非空白字符的行;

~]# grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg

4、找出"netstat  -tan”命令的结果中,以‘LISTEN’后跟0或多个空白字符结尾的行;

~]# netstat -tan | grep "LISTEN[[:space:]]*$"

5、找出"fdisk  -l“命令的结果中,包含以/dev/后跟sd或hd及一个小字母的行;

~]# fdisk -l | grep "/dev/[sh]d[a-z]\>"

6、找出”ldd  /usr/bin/cat“命令的结果中文件路径;

~]# ldd /usr/bin/cat | grep -o "/[^[:space:]]\+"

  分组与引用:

\(PATTERN\):将此PATTERN匹配到的字符当作一个不可侵害整体进行处理;

Note:分组括号中的模式匹配到的字符会被正则表达式引擎自动记录于内部的变量中,这些变量是\1, \2, \3, ...

eg:

pat1\(pat2\)pat3\(pat4\(pat5\)pat6\)

说明:

\n:模式中第n个左括号以及与之匹配的右括号之间的模式所匹配到的字符串;(不是模式,而是模式匹配的结果)

\1:第一组括号中的pattern匹配到的字符串;

\2:第二组括号中的pattern匹配到的字符串;

……

eg:

He love his lover

He like his lover

He love his liker

He like his liker

l..e.*l..er

其结果为:He love his lover

He like his lover

He love his liker

He like his liker

\(l..e\).*\1r

其结果为:He love his lover

He like his liker

后向引用:引用前面的括号中的模式所匹配到的字符串;

常用选项之二:

-E, --extended-regexp:支持使用扩展正则表达式

-F, --fixed-strings:支持使用固定字符串,不支持正则表达式,相当于fgrep;

-G, --basic-regexp:支持使用基本正则表达式;

-P, --perl-regexp:支持使用pcre正则表达式;

-e PATTERN, --regexp=PATTERN:多模式机制;

-f FILE, --file=FILE:FILE为每行包含了一个pattern的文本文件,即grep script;

-A NUM, --after-context=NUM

-B NUM, --before-context=NUM

-C NUM, -NUM, --context=NUM

egrep:  支持使用扩展正则表达式的grep命令,相当于grep -E;

语法:

egrep [OPTIONS] PATTERN [FILE...]

扩展正则表达式的元字符:

字符匹配:

.:任意单个字符

[ ]:范围内的任意单个字符

[^ ]:范围外的任意单个字符

例子与上面介绍grep的例子雷同,这里就不一一列出

匹配次数:

*:任意次;

?:0次或1次;

+:1次或多次;

{m}:匹配m次;

{m,n}:至少m次,至多n次;

{0,n}

{m,}

位置锚定:

^:行首

$:行尾

\<, \b:词首

\>, \b:词尾

分组及引用:

(pattern):分组,括号中的模式匹配到的字符会被记录于正则表达式引擎内部的变量中;

后向引用:\1, \2, ...

或者:

a|b:a或者b

C|cat:表示C或cat

(C|c)at:表示Cat或cat

说明:egrep的正则表达式中的例子与grep中的基本相同,这里就不一一列出

练习:

1、显示/etc/passwd文件中不以bash结尾的行;

~]# egrep -v "bash$" /etc/passwd

2、找出/etc/passwd文件中的三位或四位数;

~]# egrep "\<[0-9]{3,4}\>" /etc/passwd

3、找出/etc/grub2.cfg文件中,以至少一个空白字符开头,后面又跟了非空白字符的行;

eg:egrep “^[[:space:]][a-z]+” /etc/grub2.cfg

4、找出"netstat  -tan”命令的结果中,以‘LISTEN’后跟0或多个空白字符结尾的行;

5、找出"fdisk  -l“命令的结果中,包含以/dev/后跟sd或hd及一个小字母的行;

6、找出”ldd  /usr/bin/cat“命令的结果中文件路径;

7、找出/proc/meminfo文件中,所有以大写或小写s开头的行;至少用三种方式实现;

~]# egrep "^(s|S)" /tmp/meminfo

~]# grep "^[sS]" /tmp/meminfo

~]# grep -i "^s" /tmp/meminfo

8、显示当前系统上root、centos或slackware用户的相关信息;

~]# egrep "^(root|centos|slackware)\>" /etc/passwd

9、echo输出一个绝对路径,使用egrep取出其基名;

~]# echo /etc/passwd/ | egrep -o "[^/]+/?$"

10、找出ifconfig命令结果中的1-255之间的整数;

~]# ifconfig | egrep "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>"

11、添加用户bash、testbash、basher及nologin,要求前三个用户的默认shell为/bin/bash,nologin的默认shell为/sbin/nologin,而后找出其用户名与shell名相同的用户;

~]# egrep "^([[a-z0-9]+)\>.*\1$" /etc/passwd

时间: 2024-10-17 19:54:26

llinux文本三剑客之grep、egrep及相应的正则表达式和用法的相关文章

Linux 文本处理三剑客之grep &nbsp; egrep

Linux 文本处理三剑客之grep   egrep grep: Global search REgular expression andPrint out the line. 作用:文本搜索工具,根据用户指定的"模式(pattern)"逐行去搜索目标文本,打印匹配到的行. 模式:由正则表达式的元字符及文本字符所编写的过元字符,其中正则表达示分基本正则表达式,和扩展正则正则表达式2类 元字符不表示其字面意义,而用于表示通配或控制功能滤条件.元字符有下面一些 字符匹配: .:匹配任意单个

linux 文件管理和文本三剑客之一grep,以及正则的使用

1:文件权限 用户对文件的访问有三种:r(读),w(写),x.对于文件和目录有点区别. 文件: r:使用文本查看工具可以查看其文件内容. w:使用文本编辑工具可以编辑其文件内容. x:可向内核请求将此文件运行为进城执行. 目录: r:可以使用ls命令列出文件下子目录和文件的列表. w:可以在此目录中创建和删除文件. x:可使用'ls -l'命令列出目录及子目录的文件属性,可以使用cd切换工作目录为制定目录. 文件权限主要针对三类对象进行定义. owner:属主  , group:属组, othe

Linux中 文本处理命令 grep egrep fgrep的使

个人见解:我认为Linux中的文本处理命令 grep egrep fgrep命令 其实只要牢牢掌握grep就可以了 因为其他两个几乎是一样的 不一样的地方也很好区分 grep 基本使用方法: 使用方法 grep [选项] '表达式' #学习的时候没好好听 不知道自己写错没 为了这篇博文的通常 我还是先不看之前学习的视频了这里的常用选项有 -o -v -i -n -A -B -C -数字 -E [email protected]:~# grep -o '^root:' /etc/passwd #-

文本三剑客(grep、sed、awk)

文档:文本三剑客(grep.sed.awk).note链接:http://note.youdao.com/noteshare?id=d6b2cb636b40803cf543f3f0b44bed9f&sub=1D4DA6B89EC74E9597672AADF0CE3894 原文地址:https://blog.51cto.com/12928116/2407036

linux下grep、egrep及相应的正则表达式和用法

     linux下grep.egrep及相应的正则表达式和用法                       一.简介      Linux上文本处理三剑客(引用自马哥教育 ):  grep, egrep, fgrep:文本搜索工具:基于"pattern"对给定文本进行搜索操作:     sed:Stream EDitor,流编辑器,行编辑工具:文本编辑工具:     awk:GNU awk,文本格式化工具:文本报告生成器:         grep (缩写来自Globally se

grep, egrep及相应的正则表达式用法详解

grep, egrep及相应的正则表达式用法详解 一.grep/egrep Global search REgular expression and Print out的简写,是一种强大的文本搜索工具,它根据用户指定的文本模式(正则表达元字符以及正常字符组合而成)对目标文件进行逐行搜索,并把匹配的行打印出来.Unix的grep家族包括grep.egrep和fgrep. linux使用GNU版本的grep.它功能更强,可以通过-E.-F命令行选项来使用egrep和fgrep的功能(fgrep不使用

Linux文本处理之 grep egrep

linux下文本处理三剑客 第一剑 grep, egrep, fgrep:文本搜索工具:基于"pattern"对给定文本进行搜索操作: 第二剑 sed:Stream EDitor,流编辑器,行编辑工具:文本编辑工具: 第三剑 awk:GNU awk,文本格式化工具:文本报告生成器: 今天主要讲解第一剑: grep家族: grep:  支持使用基本正则表达式: egrep:支持使用扩展正则表达式: grep: 不支持使用正则表达式: grep命令: 作用:文本搜索工具,根据用户指定的&q

linux文本处理三剑客之grep家族及其相应的正则表达式使用详解

一.Linux文本处理三剑客.grep家族和正则表达式介绍 Linux上文本处理三剑客: grep(egrep, fgrep):文本搜索工具:基于"pattern(过滤条件)"对目标文本进行逐行搜索操作: sed:Stream Editor,流编辑器行编辑工具:文本编辑工具: awk:GNU awk,文本格式化工具:文本报告生成器: grep家族: grep: Global search REgular expression and Print out the line,支持使用基本正

文本三剑客之grep加vim编辑器

好几周没写博客了,今天又时间就随便写了点. linux文本处理三剑客: grep:文本过滤工具 grep ,egrep,fgrep(用来打印各种行,patten模式) 它需要标准输入,CentOS6里也可以实现标红.alias gerp 是别名 nmap -v -sp 172......0/24 |gerp -B1 "Host is up" 扫描ip地址 grep 数字加字母加下划线都算单词的一部分. grep 支持正则表达式 grep -w 过滤单词的 如: ls |grep -w