正则表达式的用法详解

一、何谓正则表达式

正则表达式是是由元字符及正常字符所书写的模式,其中的元字符不表示字符本身的意义,而是用于表达控制或通配等功能。

二、基本正则表达式元字符:

(1) 字符(范围)匹配

.  :匹配任意单个字符
            [] :匹配指定范围内的任意单个字符
            [^]:匹配指定范围外的任意单个字符
                [0-9],[[:digit:]],[^0-9],[^[:digit:]]
                [a-z],[[:lower:]]
                [A-Z],[[:upper:]]
                [[:space:]]
                [[:punct:]]
                [0-9a-zA-Z],[[:alnum:]]
                [a-zA-Z],[[:alpha:]]

(2) 次数匹配:在期望匹配字符后面提供一个控制符,用于表达匹配其前面字符指定的次数

* :任意长度,表示0次、1次或多次
                  "ab*c"
                      abbc,ac
                      abb,
                .*:任意长度的任意字符,工作于贪婪模式
                \?:0次或1次,表示其左侧字符可有可无
                    "ab\?c"
                      abbc,
                      ac,abc
                \+: 1次或多次,表示其左侧字符至少出现1次
                \{m\}:m次,表示其左侧字符精确出现m次
                \{m,n\}:至少m次,至多n次
                \{0,n\}:至多n次
                \{m,\}:至少m次

(3)位置锚定:

^:锚定行首 ^PATTERN
                 $:锚定行尾 PATTERN$

^PATTERN$:用模式来匹配整行

^$:匹配空白行

(4)单词锚定:由非特殊字符组成的连续的字符串

\<:锚定词首,也可用\b
                \<PATTETN 或\b

\>:锚定词尾。也可用\b

PATTERN\>
                               
            \<PATTERN\>:匹配PATERN能匹配到的整个单词

(5) 分组:\(\)

注意:分组中的模式,在某次的具体匹配过程中所匹配到的字符,可以被grep记忆(保存于内置的变量中,这些变量是\1,\2,...),因此还可以被引用:

\1:引用,模式中自左而右,由第一个左括号以及与之对应的右括号中的模式所匹配到的内容

\2:引用,模式中自左而右,由第二个左括号以及与之对应的右括号中的模式所匹配到的内容

三、grep简介

grep(Global search Regular expression and Print out the line)全局搜索正则表达式,并把搜索到符合条件的一行输出。

grep命令格式:

grep [OPTIONS] PATTERN [FILE...]

*     PATTERN是正则表达式书写的模式

*     FILE是要查找的文件,可以是空格间隔的多个文件,省略FILE时表示在标准输入中查找

常用的参数:

--> -o: 只显示匹配到的字符

--> -i ignore case,不区分字符的大小写

--> -v 反向选取,显示不能够被匹配到的行

--> -E 使用扩展的正则表达式

--> -A# 同时输出匹配行的后#行

--> -B# 同时输出匹配行的前#行

--> -C# 同时输出匹配行的前、后#行

例子:grep --color=auto "root"  /etc/passwd

四、egrep :命令会在输入文件中中搜索与用 Pattern 参数指定的模式相匹配的行

命令格式:egrep PATTERN FILE ...

(1)字符匹配:
   .:匹配任意单个字符
   []:匹配指定范围内的任意单个字符
   [^]:匹配指定范围外的任意单个字符
 (2) 次数匹配:
   *: 任意次
   ?:0或1次
   +: 至少1次
   {m}:精确匹配m次;
   {m,n}:至少m次,至多n次;
   {m,}:至少m次;
   {0,n}:至多n次;
  (3)位置锚定:
   ^
   $
   \<, \b
   \>, \b
  (4)分组:
   ()

引用:\1, \2, ...
  或者:
   a|b:a或者b
    或者两侧的所有内容;

举例:

1、显示/proc/meminfo文件中以大写或小写S开头的行

[[email protected] /]# grep -E "^[sS]" /proc/meminfo
SwapCached:            0 kB
SwapTotal:       2097148 kB
SwapFree:        2097148 kB
Shmem:               280 kB
Slab:              60008 kB
SReclaimable:      34660 kB
SUnreclaim:        25348 kB

2、显示/etc/passwd文件中其默认shell为/bin/bash的用户

[[email protected] /]# grep "/bin/bash$" /etc/passwd | cut -d: -f1
root
mandriva
mageia
mandriva1
opstack
nova
hadoop
mysql1
user1
user10
user11

时间: 2025-01-16 09:20:20

正则表达式的用法详解的相关文章

正则表达式的用法详解(字符判读的利器)

- (BOOL)validateNumber:(NSString *) textString { NSString* [email protected]"^[0-9]+$"; NSPredicate *numberPre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",number]; return [numberPre evaluateWithObject:textString]; } 其中下述语句就是一

grep, egrep及相应的正则表达式用法详解

grep, egrep及相应的正则表达式用法详解 一.grep/egrep Global search REgular expression and Print out的简写,是一种强大的文本搜索工具,它根据用户指定的文本模式(正则表达元字符以及正常字符组合而成)对目标文件进行逐行搜索,并把匹配的行打印出来.Unix的grep家族包括grep.egrep和fgrep. linux使用GNU版本的grep.它功能更强,可以通过-E.-F命令行选项来使用egrep和fgrep的功能(fgrep不使用

grep用法详解 grep与正则表达式

Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户. 主要参数    [options]主要参数:    -c:只输出匹配行的计数.    -I:不区分大 小写(只适用于单字符).    -h:查询多文件时不显示文件名.    -l:查询多文件时只输出包含匹配字符的文件名.    -n:显示匹配行及 行号.    -s

php邮箱地址正则表达式实现与详解

本文章不但要讲述了关于正则达式而且还讲述了关于邮箱正则的构成用法详解,有需要了解的朋友可以参考一下,同时我们也提供了多种不同的邮箱验证实例.正则表达式了 ^[_.0-9a-z-][email protected]([0-9a-z][0-9a-z-]+.)+[a-z]{2,3}$ 在这段正则表达式中,“+”表示前面的字符串连续出现一个或多个:“^”表示下一个字符串必须出现在开头,“$”表示前一个字符串必须出现在结尾: “.”也就是“.”,这里“”是转义符:“{2,3}”表示前面的字符串可以连续出现

[转]notepad++正则表达式替换字符串详解

原文:http://blog.csdn.net/qinboecjtu/article/details/6035028 正则表达式是一个查询的字符串,它包含一般的字符和一些特殊的字符,特殊字符可以扩展查找字符串的能力,正则表达式在查找和替换字符串的作用不可忽视,它 能很好提高工作效率. EditPlus的查找,替换,文件中查找支持以下的正则表达式: 表达式 说明 /t 制表符. /n 新行. . 匹配任意字符. | 匹配表达式左边和右边的字符. 例如, "ab|bc" 匹配 "

C++ string 用法详解

/////////////////////////////////////////////////////////////////////////////////// 任何人对本文进行引用都要标明作者是Nicolai M.Josuttis /////////////////////////////////////////////////////////////////////////////////// C++ 语言是个十分优秀的语言,但优秀并不表示完美.还是有许多人不愿意使用C或者C++,为什

基础正则表达式和fgrep详解

[grep/ egrep] 语法: grep [-cinvABC] 'word'filename -c :打印符合要求的行数 -i :忽略大小写 -n :在输出符合要求的行的同时连同行号一起输出 -v :打印不符合要求的行 -A :后跟一个数字(有无空格都可以),例如 –A2则表示打印符合要求的行以及下面两行 -B :后跟一个数字,例如 –B2 则表示打印符合要求的行以及上面两行 -C :后跟一个数字,例如 –C2 则表示打印符合要求的行以及上下各两行 #grep -A 2 halt /etc/

java爬取网页内容 简单例子(2)——附jsoup的select用法详解

http://www.cnblogs.com/xiaoMzjm/p/3899366.html [背景] 在上一篇博文java爬取网页内容 简单例子(1)——使用正则表达式 里面,介绍了如何使用正则表达式去解析网页的内容,虽然该正则表达式比较通用,但繁琐,代码量多,现实中想要想出一条简单的正则表达式 对于没有很好正则表达式基础的人——比如说我T_T——是一件蛮困难的事.这一篇,我们改用jsoup,一个强大的解析html工具,去解析html,你会发现,一切都变得很容易. [准备工作] 下载:jsou

JSoup 用法详解

清单 1 // 直接从字符串中输入 HTML 文档 String html = "<html><head><title> 开源中国社区 </title></head>" + "<body><p> 这里是 jsoup 项目的相关文章 </p></body></html>"; Document doc = Jsoup.parse(html); // 从