一、正则表达式
简单地说,正则表达式就是处理字符串的方法,它以行为单位来进行字符串的处理行为,通过一些特殊的符号的辅助,可以让用户轻易打到查找、删除、替换某特定字符串的处理程序。这些特殊字符称为元字符,其不表示字符本身的意义,用于额外功能性的描述。正则表达式又分为基础正则与扩展正则。
1)基础正则表达式
元字符:
.: 匹配任意单个字符
[char]: 匹配指定范围内的任意单个字符
[^char]:匹配指定范围外的任意单个字符
字符集合: [:digit:], [:lower:], [:upper:], [:punct:], [:space:], [:alpha:],[:alnum:]
匹配次数(贪婪模式):
*: 匹配其前面的字符任意次 \+:匹配其前面的字符至少一次
.*: 任意长度的任意字符 \?: 匹配其前面的字符1次或0次
\{m,n\}:匹配其前面的字符至少m次,至多n次
位置锚定:指定字符出现位置
^: 锚定行首,此字符后面的任意内容必须出现在行首
$: 锚定行尾,此字符前面的任意内容必须出现在行尾
^$: 空白行
\<或\b: 锚定词首,其后面的任意字符必须作为单词首部出现
\>或\b: 锚定词尾,其前面的任意字符必须作为单词尾部出现
分组:
\( \) 如:\(ab\)*,将ab最为一个整体匹配
\n:后向引用,引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容
2)扩展正则表达式
扩展正则表达式,与基本正则表达式的不同在于其不再需要转译,增加了“|”这个命令。这里仅介绍其不同之处。
+: 匹配其前面的字符至少1次
?: 匹配其前面的字符1次或0次
{m,n}:匹配其前面的字符至少m次,至多n次
(): 分组
a|b: a或者b
二、grep的使用
作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行;其基本格式为
grep [OPTIONS] PATTERN [FILE...]
[OPTIONS]: 其主要选项有
-i:忽略大小写--color=auto: 对匹配到的文本着色显示;
-v:显示没有被模式匹配到的行 -o:只显示被模式匹配到的字符串
-E:使用扩展正则表达式 -q: 静默模式,不输出任何信息;
-A #:after, 后#行 -B #: before, 前#行
-C #:context, 前后各#行
PATTERN:由正则表达式字符及文本字符所编写的过滤条件
由于grep同胞的另外两个命令,egrep相当于 grep -E,fgrep不支持正则表达式,这里就不再说明
三、实例
1、显示/proc/meminfo文件中以大小s开头的行;
[[email protected] ~]# grep -i --color=auto "^s" /proc/meminfo SwapCached: 0 kB SwapTotal: 0 kB SwapFree: 0 kB Shmem: 180 kB Slab: 68012 kB SReclaimable: 48860 kB SUnreclaim: 19152 kB
2、显示/etc/passwd文件中不以/bin/bash结尾的行;
[[email protected] ~]# grep -v --color=auto "/bin/bash$" /etc/passwd bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt mail:x:8:12:mail:/var/spool/mail:/sbin/nologin uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin games:x:12:100:games:/usr/games:/sbin/nologin gopher:x:13:30:gopher:/var/gopher:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin nobody:x:99:99:Nobody:/:/sbin/nologin vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin ntp:x:38:38::/etc/ntp:/sbin/nologin saslauth:x:499:76:"Saslauthd user":/var/empty/saslauth:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin tcpdump:x:72:72::/:/sbin/nologin dbus:x:81:81:System message bus:/:/sbin/nologin apache:x:48:48:Apache:/var/www:/sbin/nologin haldaemon:x:68:68:HAL daemon:/:/sbin/nologin mysql:x:498:499::/home/mysql:/sbin/nologin
3、显示/etc/passwd文件中ID号最大的用户的用户名;
[[email protected] ~]# sort -n -t: -k 3 /etc/passwd | tail -1 | cut -d: -f1 mylinux
4、如果用户root存在,显示其默认的shell程序;
[[email protected] ~]# id root &> /dev/null && grep "^root\>" /etc/passwd | cut -d: -f7 /bin/bash
5、找出/etc/passwd中的两位或三位数;
[[email protected] ~]# grep -E --color=auto "\<[0-9]{2,3}\>" /etc/passwd mail:x:8:12:mail:/var/spool/mail:/sbin/nologin uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin games:x:12:100:games:/usr/games:/sbin/nologin gopher:x:13:30:gopher:/var/gopher:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin nobody:x:99:99:Nobody:/:/sbin/nologin vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin ntp:x:38:38::/etc/ntp:/sbin/nologin saslauth:x:499:76:"Saslauthd user":/var/empty/saslauth:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin tcpdump:x:72:72::/:/sbin/nologin dbus:x:81:81:System message bus:/:/sbin/nologin apache:x:48:48:Apache:/var/www:/sbin/nologin haldaemon:x:68:68:HAL daemon:/:/sbin/nologin mysql:x:498:499::/home/mysql:/sbin/nologin mylinux:x:500:500::/home/mylinux:/bin/bash
6、显示/etc/rc.d/rc.sysinit文件中,至少以一个空白字符开头的且后面存非空白字符的行;
grep -E --color=auto "^[[:space:]]{1,}[[:space:]]" /etc/rc.d/rc.sysinit
7、找出"netstat -tan"命令的结果中以‘LISTEN‘后跟0、1或多个空白字符结尾的行;
[[email protected] ~]# netstat -tan | grep -E --color=auto "LISTEN[[:space:]]*$" tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN tcp 0 0 0.0.0.0:5901 0.0.0.0:* LISTEN tcp 0 0 0.0.0.0:6001 0.0.0.0:* LISTEN tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN tcp 0 0 127.0.0.1:25 0.0.0.0:* LISTEN
8、添加用户bash、testbash、basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
[[email protected] ~]# grep -E --color=auto "(^.*):.*/\1$" /etc/passwd sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt bash:x:501:501::/home/bash:/bin/bash
9、写一个模式,能匹配真正意义上的IP地址;(1.0.0.1--223.255.255.254)