文本处理工具之一grep命令详解

grep(Globel Search Regular Expression and Printing out the line)全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,是一个对行进行操作的搜索工作,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。 egrep表示扩展的grep,相比grep支持更多的元字符,"grep -E"相当于egrep。fgrep是fast grep,不支持元字符,但是搜索速度更快。grep搜索的结果被送到屏幕,不影响原文件内容。

1、grep的语法[]  (man grep查看grep的帮助文档)

grep    [options]    ‘pattern‘     FILE

命令      选项         模式        文件

grep不加引号直接过滤字符串;grep在进行模式匹配的时候必须加引号,单引和双引号都可以;grep在引用变量的时候必须加双引号

2、grep的选项[option]

-r:递归的搜索

-v:反向选取,只显示不符合模式的行

-o:只显示被模式匹配到的字符串,而不是整个行

-i:匹配时不区分大小写

-A #:显示匹配到的行时,顺便显示后面的#行(#表示数值)

-B #:前面的#行

-C #:前后的#行

-E:使用扩展的正则表达式

eg:grep选项的例子

cat > eg1.text << EOF
This is first
how are you
How old are you
fine,thanks
what,so what
What is your name
EOF
grep "you" eg1.text
grep -o "you" eg1.text
grep -v "you" eg1.text
grep -i "what" eg1.text
grep -A 1 "fine" eg1.text
grep -B 1 "fine" eg1.text
grep -C 1 "fine" eg1.text

以上代码直接粘贴复制在linux上可直接运行,代码解释运行效果,如下

3、

正则表达式(man regex)是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,通常被用来检索或替换那些符合某个

模式的文本内容。正则表达式分为:基本正则表达式和扩展正则表达式。

元字符就是指那些在正则表达式中具有特殊意义的专用字符。

grep支持基本正则表达式的元字符:

^:锚点行首的符合条件的内容,用法格式"^pattern"

$:锚点行首的符合条件的内容,用法格式"pattern$"

^$:匹配空白行

.:匹配任意单个字符

*:匹配紧挨在前面的字符任意次(0,1,多次)

.*:匹配任意长度的任意字符

\?:匹配紧挨在前面的字符0次或1次

\{m,n\}:匹配其前面的字符至少m次,至多n次

\{m,\}:匹配其前面的字符至少m次

\{m\}:精确匹配前面的m次

\{0,n\}:0到n次

\<:锚点词首----相当于\b,用法格式:\<pattern

\>:锚点词尾,用法格式:\>pattern

\<pattern\>:单词锚点

\(\):分组,用法格式:\(pattern\),引用第一个小括号的分组\1,第二个是\2,以此类推

[]:匹配指定范围内的任意单个字符

[^]:匹配指定范围外的任意单个字符

eg:基本正则表达的例子

(1)、显示/proc/meminfo文件中以不区分大小的s开头的行;

grep "^[sS]" /proc/meminfo

(2)、显示/etc/passwd中以nologin结尾的行;

grep "nologin$" /etc/passwd

(3)、显示/etc/inittab中空格开头的行;

grep "^$" /etc/inittab

(4)、显示/etc/passwd中,以r开头的字符而后跟了任意单个字符的行;

grep --color "^r." /etc/passwd

(5)、显示/etc/passwd中,以r开头后跟了o,o出现任意次的行;

grep --color "^ro*" /etc/passwd

(6)、显示/etc/passwd文件中,r后跟了任意长度任意字符后跟了h的行;

grep --color "r.*h" /etc/passwd

(7)、显示/etc/passwd中,r后跟了o,o出现0次或者1次的行;

grep --color "ro\?" /etc/passwd

(8)、显示/etc/passwd中,r后跟了o,o出现至少1次至多2次的行;

grep --color "ro\{1,2\}" /etc/passwd

(9)、显示/etc/passwd中,r后跟了o,o只出现2次的行;

grep --color "ro\{2\}" /etc/passwd

(10)、显示/etc/passwd中,匹配root这个单词的行;

grep --color "\<root\>" /etc/passwd

grep支持扩展表达式的元字符:支持所有基本正则表达式的元字符,有些和基本元字符在用法上不一样,扩展正则表达式的命令egrep或者grep -E

?:匹配紧挨在前面的字符0次或1次

{m,n}:至少m次,至多n次

():分组

+:至少匹配前面的字符一次

a|b:匹配a或者b

eg:扩展正则表达式的例子

(1)、显示/etc/passwd中,r开头后跟了o,o出现0次或者1次的行;

egrep --color "ro?" /etc/passwd

(2)、显示/etc/passwd中,r开头后跟了o,o出现至少1次至多2次的行;

egrep --color "ro{1,2}" /etc/passwd

(3)、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的;

egrep --color "^([0-9]).*\1$"  /etc/inittab

(4)、显示/etc/passwd中,r开头后跟了o,o出现至少1次;

egrep --color "ro+" /etc/passwd
grep -E --color  "ro{1,}" /etc/passwd

(5)、显示/etc/passwd中,匹配root或者halt的行;

egrep --color "root|halt" /etc/passwd

(6)、显示/var/log/secure文件中包含"LOGIN ON"或者"Failed passwd"的行;

egrep --color "(LOGIN ON|Failed passwd)" /var/log/secure

grep支持字符和字符集合

\d:数字字符匹配。等效于 [0-9]。

\s:匹配任何空白字符,包括空格、制表符、换页符等。与 [ \f\n\r\t\v] 等效。

\S:匹配任何非空白字符。与 [^ \f\n\r\t\v] 等效

\w:匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。

\W:与任何非单词字符匹配。与“[^A-Za-z0-9_]”等效。

[:digit:]:所有数字, 相当于0-9 或者\d

[:lower:]:所有的小写字母

[:upper:]:所有的大写字母

[:alpha:]:所有的字母

[:alnum:]:相当于[0-9a-zA-Z]

[:space:]:空白字符 相当于\s

[:punct:]:所有标点符号

eg:支持字符集合的例子

(1)、显示/etc/rc.d/rc.sysinit中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;

grep "^#[[:space:]]\{1,\}[^[:space:]]"  /etc/rc.d/rc.sysinit
grep -E "^#\s{1,}\S" /etc/rc.d/rc.sysinit

(2)、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;

grep --color ":[[:digit:]]:" /etc/inittab
grep --color ":\d:" /etc/inittab

经典的例子

(1)、分组的例子

cat > test.txt <<EOF
He like his liker
He love his lover
She love her lover
She like her lover
EOF
grep "l..e.*l..er" test.txt
grep "\(l..e\).*\1r" test.txt

(2)、匹配1-255的数字

cat > num.txt << EOF
12
234
255
256
EOF
grep --color -E "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>" num.txt

(3)、匹配ABC类IP地址即 1.0.0.1---223.255.255.254

cat > ip.txt <<EOF
1.0.0.254
1.0.0.255
1.2.3.4
223.255.255.254
224.255.255.252
2.255.255.255
EOF
grep -E --color "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>" ip.txt

(4)、匹配Email地址:任意长度数字字母@任意长度数字字母.(com|org|net等等)

cat > email.txt << EOF
[email protected]
[email protected]
[email protected]
jerry#[email protected]
[email protected]
EOF
grep -E --color "^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$" email.txt

(5)、匹配手机号码:手机号码是1[3|4|5|8]后面接9位数字的

cat > tel.txt << EOF
13690876890
12589098379
15608764083
15820974619
138074082711
18618203761
19209783900
1329873909
EOF
grep --color -E "\<1[3|4|5|8][0-9]{9}\>" tel.txt

======博主所学知识来着于恩师马哥的亲授======

马哥教育“2014夏令营”开始啦!!!马哥教育是目前性价比最高的Linux培训,国内好评度排名第一,并被网友称为Linux界的"黄埔军校",全部课程采用Centos6.5x86_64讲解,经过几期网络班的总结和锤炼,逐渐完善的课程体系,学员学习进度监督和优质的考试系统检验学员掌握程度,活跃的在线答疑环节,名师陪伴,牛人指点,精彩不容错过。

详情猛戳:http://www.magedu.com/

课程内容:http://www.magedu.com/mentuqc

网络班一体化服务:http://mageedu.blog.51cto.com/4265610/1379598

联系方式:客服QQ
2813150558  客服QQ  1661815153

============================================

文本处理工具之一grep命令详解,布布扣,bubuko.com

时间: 2024-10-20 10:41:23

文本处理工具之一grep命令详解的相关文章

linux文本处理三剑客之grep命令详解

Linux文本处理三剑客之grep grep:文本过滤(模式:pattern)工具 grep, egrep, fgrep(不支持正则表达式搜索) sed:stream editor,文本编辑工具 awk:Linux上的实现gawk,文本报告生成器 grep grep: Global search REgularexpression and Print out the line 作用:文本搜索工具,根据用户指定的"模式"对目标文本逐行进行匹配检查:打印匹配到的行 模式:由正则表达式字符及

linux grep命令详解

linux grep命令详解 http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2856896.html grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. Unix的grep家族包括grep.egrep和fgrep.egrep和fgrep的命令只跟gr

grep命令详解

grep命令是linux下的行过滤工具,其参数繁多,下面就一一介绍个个参数的作用,希望对大家有所帮助.grep -- print lines matching a pattern (将符合样式的该行列出)◎语法: grep [options] PATTERN [FILE...] grep用以在file内文中比对相对应的部分,或是当没有指定档案时, 由标准输入中去比对. 在预设的情况下,grep会将符合样式的那一行列出.此外,还有两个程序是grep的变化型,egrep及fgrep. 其中egrep

grep 命令详解及相关事例

一.匹配字符 .    匹配任意单个字符 [ ]  匹配指定范围内的任意字符 [^]  匹配飞指定范围内的任意字符 [:alpha:] 字母字符 [:lower:] 小写字母字符 [:upper:] 大写字母字符 [:digit:] 数字 [:alnum:] 字母数字字符 [:space:] 空白字符(禁止打印),如回车符.换行符.竖直制表符和换页符 [:punct:] 标点字符 [:cntrl:] 控制字符(禁止打印) [:print:] 可打印字符 使用时一般使用两个中括号,具体会在下面的例

Linux三剑客之grep命令详解

先来小菜一碟: cat /etc/passwd | grep -c "/bin/bash$" 以上,用来统计/etc/passwd 文件中以/bin/bash结尾的用户个数. grep用来基于正则去实现行过滤的工具:它有很多衍生命令: egrep 扩展的grep,即默认使用扩展正则表达式的grep,更高级. fgrep 专用于文件行过滤的工具. grep命令格式:grep [option] pattern file        option表示选项,pattern 表示要匹配的模式,

Linux中文本搜索工具“grep”命令详解

人生中应该有两次冲动,一次是轰轰烈烈的爱情,一次是说走就走的旅行.我属于第三种,轰轰烈烈的辞职然后马不停蹄的参加了马哥的linux面授班,两周时间内对linux有了些初步的了解,与此同时,两周内八天课程中的各种定义.概念.原理.命令由于量大.琐碎,也着实给我们这些小白一个下马威,即使每天11点撤退也觉得时间不够用.鉴于对自己的负责和马哥的作业要求,特对文本搜索工具grep写些使用指南,其中可能会有描述不确切或有偏颇之处,望及时指正. 开始--. 首先,要说一下grep是什么,用在什么地方. gr

shell --- grep 命令详解

一.grep  ---- "行过滤工具" grep ( global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来 )是一种强大的文本搜索工具,它能使用正则表达式搜索文本,查找包含某些字符串的行或符合某个模式(Pattern)的一类字符串的行,并把匹配的行打印出来.   grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则

Linux入门基础之grep命令详解及正则表达式

grep命令是linux下经常使用的命令之一,能根据用户指定的模式(pattern)对文本进行过滤,显示出匹配到的行.其命令格式为: grep [OPTIONS] PATTERN [FILE] 例如:我们要查找网卡0中配置的IP地址(该文件路径: /etc/sysconfig/network-scripts/ifcfg-eth0)---grep 'IPADDR' /etc/sysconfig/network-scripts/ifcfg-eth0 (注:alias grep='grep --col

linux每天一小步---grep命令详解

1 命令功能 grep(global regular expression print全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2,我们利用这些返回值就可进行一些自动化的文本处理工作. 2 命令语法 grep [选项] 模式pattern [文件名file]    注:模式