轻松学习正则表达式

转载自:http://www.cnblogs.com/jamesping/articles/2252675.html

装载自:http://www.cnblogs.com/sxwgf/archive/2011/11/17/2252076.html

继续把我在个人博客上新翻译的文章投递到博客园来,这次是有关正则表达式的,很基础,主要是让读者把握住正则表达式中的3种括号的用法,用这3种括号几乎可以涵盖所有的正则式。

写在最前面

前两天我从CodeProject上翻译了一篇关于Javascript的文章《Javascript中的陷阱大集合》,初次翻译技术文章,可能有很多地方需要改进,我个人觉得最好的改进办法就是继续去翻译其他文章,取长补短,积极思考,呵呵。

今天翻译的这篇文章是关于正则表达式的,英文原文为Learn Regular Expressions (RegEx) with Ease。让我们来轻松学习这令人蛋疼无比的正则表达式吧。译文允许转载,转载请在页面明显处注明以下信息:

英文原文:Learn Regular Expressions (RegEx) with Ease
译文作者:王国峰
译文标题:轻松学习正则表达式【译】
译文链接:http://www.itivy.com/ivy/archive/2011/11/16/learn-regular-expressions-with-ease.html

谢谢合作!

译文如下:

点击下面的图片可以把你带进正则表达式的学习视频教程(译者云:国内youtube不太好上,所以还是老老实实跟着我的译文学习吧,哈哈)

开篇,谈谈本文的主要内容

编写验证规则最流行和最简单的方法就是正则表达式了,但唯一的一个问题是正则表达式的语法太隐晦了,让人蛋疼无比。很多开发者为了在项目中应用复杂的验证,经常要使用一些小抄来记住正则式的复杂语法和各种常用命令。

在这篇文章中,我将试图让大家明白什么是正则表达式,以及如何更轻松地学习正则表达式。

也许你是初学者,那以防万一,我先来讲讲什么是正则表达式吧:

正则表达式可以帮助我们更好的描述复杂的文本格式。一旦你描述清楚了这些格式,那你就可以利用它们对文本数据进行检索、替换、提取和修改操作。

下面有一个正则表达式的简单例子。第一步先要引入有关正则式的命名空间:

using System.Text.RegularExpressions;

第二步就是用指定的正则式构建一个正则表达式对象,下面的正则式是用来搜索长度为10的a-z的英文字母:

Regex obj = new Regex(“[a-z]{10}”);

最后,根据正则式在指定数据中检索匹配项,如果匹配IsMatch方法就会返回true。

MessageBox.Show(obj.IsMatch(“shivkoirala”).ToString());

3个重要的正则式命令

记住正则语法最好的办法就是记住这三样东西:Bracket(括号), caret(插入符号)和Dollars(美元符号)。

B
在正则表达式中有3种类型的括号

方括号 “[“和花括号“{“ 。

方括号"["内是需要匹配的字符,花括号"{"内是指定匹配字符的数量。

圆括号“(“ 则是用来分组的。

C 插入符号 “^” 表示正则式的开始。
D 美元符号“$” 表示正则式的结束。

现在你知道上面的3个语法后,你就可以写世界上任何一条验证规则了。比如下面的例子就很好的说明了上面3条正则语法是如何协调运作的。

(译者注:上图有个错误,"()"应为"{}")

  • 上面的这条正则式只能匹配a-z的英文字母,同样是在中括号中标明匹配范围。
  • 花括号中则是标明匹配字符串的最小长度和最大长度。
  • 最后为了让表达式更规则,分别在开头和结尾加上了插入符号"^"和美元符号"$"。

好了,现在我们就用上面的3条语法来实现一些正则表达式的验证规则吧。

检查用户是否输入了shivkoirala?

shivkoirala

让我们开始第一个验证,输入的字符在a-g之间?

[a-g]

输入的字符在a-g之间并且长度为3?

[a-g]{3}

输入的字符在a-g之间并且最大长度为3最小长度为1?

[a-g]{1,3}

我如何在匹配像91230456, 01237648那样的固定8位数?

^[0-9]{8}$

如何验证最小长度为3最大长度为7的数字,如:123, 1274667, 87654?

^[0-9]{3,7}$

如何验证像LJI10201020那样的发票编号,前3个是字母剩余为8位长度的数字?

前三个是字母:

^[a-z]{3}

后面是8位长度的数字:

[0-9]{8}

所以整个表达式为:

^[a-z]{3}[0-9]{8}$

验证像INV19020303 或 inv82083003那样的前3位是不区分大小写的英文字母,剩余8位是数字

在前面的表达式中只能匹配前3个是小写英文字母的发票编号,如果我们输入大写字母那就不能匹配了。所以为了确保前3个字母是不区分大小写的,我们就要用表达式^[a-zA-Z]{3}。

完整的正则式如下:

^[a-zA-Z]{3}[0-9]{8}$

我们可以验证简单的网址URL格式吗?

第一步:检查是否存在www:

^www.

第二步:域名必须是长度在1-15的英文字母:

. [a-z]{1,15}

第三部:以.com或者.org结束:

. (com|org)$

完整的表达式如下:

^www[.][a-z]{1,15}[.](com|org)$

让我们在来看看BCD(其实也就是上面说的3条基本语法)如何验证email格式

第一步:email开始是长度在1-10的英文字母,最后跟一个"@":

^[a-zA-Z0-9]{1,10}@

第二步:@后面是长度在1-10的英文字母,后面跟一个".":

[a-zA-Z]{1,10}.

第三步:最后以.com或.org结束:

.(com|org)$

最后完整的表达式如下:

^[a-zA-Z0-9]{1,10}@[a-zA-Z]{1,10}.(com|org)$

验证值在0-25的数字:

^(([0-9])|([0-1][0-9])|([0-2][0-5]))$

验证格式为MM/DD/YYYY, YYYY/MM/DD and DD/MM/YYYY的日期:


步骤


正则式


描述说明


先来检查 DD. 首先DD的长度为1-29 ( 2月份) , 1-30 (月小) , 1-31 (月大) .

所以 DD 就是 1-9 或 01-09


[1-9]|0[1-9]


允许用户输入1-9或者01-09.


再为DD添加匹配10-19


[1-9]|1[0-9]


允许用户输入01-19.


再为DD添加匹配20-29


[1-9]|1[0-9]|2[0-9]


允许用户输入01-29.


i再为DD添加匹配30-31


[1-9]|1[0-9]|2[0-9]|3[0-1]


最后用户可以输入01-31.


再来匹配日期间的分隔符"/","-"


[/ . -]


允许用户输入日期分隔符.


MM也是类似的操作


[1-9]|0[1-9]|1[0-2]


让用户输入月份值01-12.


最后就是YY的操作


1[9][0-9][0-9]|2[0][0-9][0-9]


允许用户输入年份1900-2099.

最后DD/MM/YYYY格式的日期的正则表达式为:

^([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .]([1-9]|0[1-9]|1[0-2])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

MM/DD/YYYY格式的日期:

^([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

YYYY/MM/DD格式的日期:

^(1[9][0-9][0-9]|2[0][0-9][0-9])[- / .]([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])$

快捷命令

你也可以用以下的快捷命令来简化你的正则表达式

实际命令 快捷命令
[0-9] \d
[a-z][0-9][_] \w
0次或多次发生 *
至少一次发生 +
0次或1次发生 ?

(译文完)

转载请注明英文原文链接译文链接,谢谢合作。

时间: 2024-08-07 16:59:03

轻松学习正则表达式的相关文章

轻松学习grep

grep介绍 1,grep全名(Global Regular Expression Print). 也许刚接触这个命令的人会有一种这样的感觉,不就是查找东西的一个小命令吗,no,no,no, grep是一个最初用于unix操作系统的命令行工具.在给出文件列表或标准输入后,grep会对匹配一个或多个正则表达式的文本进行搜索,并只输出匹配(或者不匹配)的行或文本,并把匹 配的行打印出来. Unix的grep家族包 括grep.egrep和fgrep.其中egrep是grep的扩展,支持更多的re元字

轻松学习C语言编程的秘诀:总结+灵感

目前在准备一套C语言的学习教程,所以我这里就以C语言编程的学习来讲.注意,讲的是"轻松学习",那种不注重方法,拼命玩命的方式也有其效果,但不是我提倡的.我讲究的是在方式方法对头.适合你.减轻你学习负担和心里压力的前提下,才适当的抓紧时间. 因此,探索一种很好的学习方法就是我所研究的主要内容. 众所周知,学习C语言并非易事,要学好它更是难上加难.这和你期末考试背会几个题目的答案考上满分没多大关系,也就是说你考试满分也说明不了你学好.学精通了C语言.那么怎么才算学精通C语言?闭着眼睛对自己

Javascript学习-------正则表达式

Javascript RegExp对象(正则表达式对象): RegExp:是一种模式. 当你要检索某个文本时,可以使用这种模式来描述要检索的内容. 创建RegExp对象: 使用RegExp的显式构造函数创建:             new RegExp("pattern"[,flags])        使用RegExp的隐式构造函数创建:             /pattern/[flags] 解释:pattern是要使用的正则表达式模式文本 flags设置正则表达式的标志信息

30天轻松学习javaweb_打包web项目成war

jar -cvf news.war news 打包成 war 包后复制到webapps下,Tomcat将会解压. 30天轻松学习javaweb_打包web项目成war,布布扣,bubuko.com

30天轻松学习javaweb_模拟tomcat

运行 javac Server.java 编译java文件 执行 java Server 运行程序 在ie中输入 http://localhost:9999/ 打开模拟的服务程序 import java.net.*; import java.io.*; public class Server { public static void main(String args[]) throws Exception { System.out.println("start"); ServerSoc

SpringMVC轻松学习-注解的使用(三)

根据上一讲的例子,我们下面就注解的使用进行详细说明. 我们采用sprng MVC开发项目时,通常都会采用注解的方式,这样可以大大提高我们的开发效率.实现零配置.下面我们从零开始重新做一个spring MVC的配置.这个项目完全采用注解的方式开发.同时,我们以后的spring MVC项目也都会采用注解的方式. 修改web.xml,文件内容如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 <?xml version=

SpringMVC轻松学习-其他常用(四)

Spring MVC 3.0 深入 核心原理 1.      用户发送请求给服务器.url:user.do 2.      服务器收到请求.发现DispatchServlet可以处理.于是调用DispatchServlet. 3.      DispatchServlet内部,通过HandleMapping检查这个url有没有对应的Controller.如果有,则调用Controller. 4.      Controller开始执行. 5.      Controller执行完毕后,如果返回字

轻松学习JavaScript十一:JavaScript基本类型(包含类型转换)和引用类型

一值的类型 早在介绍JS的数据类型的时候就提到过基本类型和引用类型,不过在说两种类型之前,我们先来了解一下变量的 值的类型.在ECMAScript中,变量可以存在两种类型的值,即原始值和引用值. (1)原始值 存储在栈中的简单数据段,也就是说,它们的值直接存储在变量访问的位置. (2)引用值 存储在堆中的对象,也就是说,存储在变量处的值是一个指针,指向存储对象的内存处. 为变量赋值时,ECMAScript的解释程序必须判断该值是原始类型,还是引用类型.要实现这一点,解释程序则需 尝试判断该值是否

30天轻松学习javaweb_https协议的密码学

https通过非对称加密实现数据安全1.CA机构提供数字证书,其中数字证书包含公钥.2.浏览器自带功能验证数字证书是否是CA机构颁发的.3.根据数字证书包含的公钥对表单数据进行加密.4.公钥提供方再根据自己的私钥对数据进行解密. 30天轻松学习javaweb_https协议的密码学,布布扣,bubuko.com