grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包 括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。
grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
正则表达式分类
基本正则表达式 (Basic Regular Expression ) BREs
扩展正则表达式 (Extend Regular Expression ) EREs
perl的正则表达式 (Perl Regular Expression ) PREs
格式
grep [options] pattern [file…]
选项和参数 (比较常用的选项,了解更多使用man grep 查看)
--color=auto
-n 加上相对应的行号
-v --invert-match 反向选取
-o --only-matching 只显示被模式匹配到的字串 ,而不是整个行
-i --ignore-case 忽略大小写
-l --files-with-matches 只列出匹配的文件名
-L --files-without-matches 只列出不匹配的文件名
-w --word-regexp 匹配完整字符串(单词)
-A Number 显示匹配到的行 并显示其后面的Number行
-B Number 显示匹配到的行 并显示其前面的Number行
-C Number …… 显示前后面的Number行
-E --extended-regexp 支持扩展正则表达式
元字符:
^:锚定行首的符合条件的内容,用法格式“^grep”;
$:锚定行尾的符合条件的内容,用法格式“grep$”;
.:匹配任意单个字符;
*:匹配紧挨在其前面的字符任意次;
.*:匹配任意长度的任意字符;
[]:匹配包含内的任一字单个字符;
[^]:匹配包含外的任一字单个字符;
\:将下一字符标记为特殊字符、文本、反向引用或八进制转义符;
\?:匹配紧挨在其前面的字符0次或1次;
\<:锚定词首
\>:锚定词尾
x\{m\}:匹配其前面的字符“x”m次(精确匹配);
x\{m,\}:匹配其前面的字符“x”至少m次;
x\{m,n\}:匹配其前面的字符“x”至少m次,至多n次;
\(\):分组;
字符集合:
[:lower:]:代表小写字母,即 a-z
[:upper:]:代表大写字母,即 A-Z
[:digit:]:代表数字,即 0-9
[:alpha:]:代表任何英文大小写字母,即 a-z A-Z
[:alnum:]:代表英文大小字符及数字,即 0-9 a-z A-Z
[:space:]:代表空格键与Tab按键
[:punct:]:代表标点符号,即 “ , ;? ! : # $
grep及正则表达式实例
1. 在/etc/paswd文件查找匹配root的串 并以高亮显示其匹配的字符串
2. 在/etc/passwd文件中查找以root开头的行 并将其显示
通过行其锚定进行匹配 此次匹配的内容仅是以root开头的行 在其他位置出现的不匹配
3. 在/etc/passwd文件中查找以/bin/bash结尾的行 并将其显示
4. 在/etc/passwd文件中查找bin的字符串和锚定后bin字符串的比较
锚定后
通过锚定/< />进行字符串完全匹配 如果不适用锚定符 将会有/sbin类似的字符串一起出来
5.在/etc/passwd文件中查找匹配俩个bin之间包含的任意字符的行
该查找以bin为分组进行匹配 命令中\1 表示引用第一个分组的内容 如果字符串中有多个分组
可以用\2\3进行引用第二分组及第三分组中的字符串
6.在/etc/passwd文件中查找匹配o 并至少出现2次的字符串的行
匹配前面字符至少2次 至少出现2次或者更多次 比如 rooot 也会一起出现的
7.在/etc/fstab文件中以#开头 且后面跟一个或者多个空白字符 而后又跟任意非空白字符的行
8. 显示/etc/fstab文件中的内容 并不显示以#开头和空白行
简单介绍到这里 后续更新 如不足之处 请多多提议
grep ,正则表达式