正则表达式学习【转】

译文转载自:http://www.cnblogs.com/sxwgf/archive/2011/11/17/2252076.html

英文原文:Learn Regular Expressions (RegEx) with Ease

正则表达式可以帮助我们更好的描述复杂的文本格式。一旦你描述清楚了这些格式,那你就可以利用它们对文本数据进行检索、替换、提取和修改操作。

下面有一个正则表达式的简单例子。第一步先要引入有关正则式的命名空间:

using System.Text.RegularExpressions;

第二步就是用指定的正则式构建一个正则表达式对象,下面的正则式是用来搜索长度为10的a-z的英文字母:

Regex obj = new Regex(“[a-z]{10}”);

最后,根据正则式在指定数据中检索匹配项,如果匹配IsMatch方法就会返回true。

MessageBox.Show(obj.IsMatch(“shivkoirala”).ToString());

3个重要的正则式命令

记住正则语法最好的办法就是记住这三样东西:Bracket(括号), caret(插入符号)和Dollars(美元符号)。

B
在正则表达式中有3种类型的括号

方括号 “[“和花括号“{“ 。

方括号"["内是需要匹配的字符,花括号"{"内是指定匹配字符的数量。

圆括号“(“ 则是用来分组的。

C 插入符号 “^” 表示正则式的开始。
D 美元符号“$” 表示正则式的结束。

现在你知道上面的3个语法后,你就可以写世界上任何一条验证规则了。比如下面的例子就很好的说明了上面3条正则语法是如何协调运作的。

(译者注:上图有个错误,"()"应为"{}")

  • 上面的这条正则式只能匹配a-z的英文字母,同样是在中括号中标明匹配范围。
  • 花括号中则是标明匹配字符串的最小长度和最大长度。
  • 最后为了让表达式更规则,分别在开头和结尾加上了插入符号"^"和美元符号"$"。

好了,现在我们就用上面的3条语法来实现一些正则表达式的验证规则吧。

检查用户是否输入了shivkoirala?

shivkoirala

让我们开始第一个验证,输入的字符在a-g之间?

[a-g]

输入的字符在a-g之间并且长度为3?

[a-g]{3}

输入的字符在a-g之间并且最大长度为3最小长度为1?

[a-g]{1,3}

我如何在匹配像91230456, 01237648那样的固定8位数?

^[0-9]{8}$

如何验证最小长度为3最大长度为7的数字,如:123, 1274667, 87654?

^[0-9]{3,7}$

如何验证像LJI1020那样的发票编号,前3个是字母剩余为8位长度的数字?

前三个是字母:

^[a-z]{3}

后面是8位长度的数字:

[0-9]{8}

所以整个表达式为:

^[a-z]{3}[0-9]{7}$

验证像INV190203 或 inv820830那样的前3位是不区分大小写的英文字母,剩余8位是数字

在前面的表达式中只能匹配前3个是小写英文字母的发票编号,如果我们输入大写字母那就不能匹配了。所以为了确保前3个字母是不区分大小写的,我们就要用表达式^[a-zA-Z]{3}。

完整的正则式如下:

^[a-zA-Z]{3}[0-9]{7}$

我们可以验证简单的网址URL格式吗?

第一步:检查是否存在www:

^www.

第二步:域名必须是长度在1-15的英文字母:

. [a-z]{1,15}

第三部:以.com或者.org结束:

. (com|org)$

完整的表达式如下:

^www[.][a-z]{1,15}[.](com|org)$

让我们在来看看BCD(其实也就是上面说的3条基本语法)如何验证email格式

第一步:email开始是长度在1-10的英文字母,最后跟一个"@":

^[a-zA-Z0-9]{1,10}@

第二步:@后面是长度在1-10的英文字母,后面跟一个".":

[a-zA-Z]{1,10}.

第三步:最后以.com或.org结束:

.(com|org)$

最后完整的表达式如下:

^[a-zA-Z0-9]{1,10}@[a-zA-Z]{1,10}.(com|org)$

验证值在0-25的数字:

^(([0-9])|([0-1][0-9])|([0-2][0-5]))$

验证格式为MM/DD/YYYY, YYYY/MM/DD and DD/MM/YYYY的日期:


步骤


正则式


描述说明


先来检查 DD. 首先DD的长度为1-29 ( 2月份) , 1-30 (月小) , 1-31 (月大) .

所以 DD 就是 1-9 或 01-09


[1-9]|0[1-9]


允许用户输入1-9或者01-09.


再为DD添加匹配10-19


[1-9]|1[0-9]


允许用户输入01-19.


再为DD添加匹配20-29


[1-9]|1[0-9]|2[0-9]


允许用户输入01-29.


i再为DD添加匹配30-31


[1-9]|1[0-9]|2[0-9]|3[0-1]


最后用户可以输入01-31.


再来匹配日期间的分隔符"/","-"


[/ . -]


允许用户输入日期分隔符.


MM也是类似的操作


[1-9]|0[1-9]|1[0-2]


让用户输入月份值01-12.


最后就是YY的操作


1[9][0-9][0-9]|2[0][0-9][0-9]


允许用户输入年份1900-2099.

最后DD/MM/YYYY格式的日期的正则表达式为:

^([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .]([1-9]|0[1-9]|1[0-2])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

MM/DD/YYYY格式的日期:

^([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

YYYY/MM/DD格式的日期:

^(1[9][0-9][0-9]|2[0][0-9][0-9])[- / .]([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])$
时间: 2024-11-04 22:09:28

正则表达式学习【转】的相关文章

正则表达式学习-JavaScript RegExp 对象

W3School 中有关于正则表达式的全面介绍:http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp 1.什么是正则表达式?正则表达式有什么用? 知道正则表达式有什么用,是学习它的最好动力. 正则表达式跟平时用的字符串操作功能函数类似.功能比它强大很多. 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过

Python正则表达式学习摘要及资料

摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2,4}? 只匹配 2 个 a. ^表示行的开头,^\d表示必须以数字开头. $表示行的结束,\d$表示必须以数字结束. 你可能注意到了,py也可以匹配'python'-->py;但是加上^py$就变成了整行匹配,就只能匹配'py'了,匹配'python'时,就什么也得不到. 参考表 正则表达式特殊序

正则表达式学习笔记---揭开正则表达式的神秘面纱

正则表达式学习笔记 如果我们问那些UNIX系统的爱好者他们最喜欢什么,答案除了稳定的系统和可以远程启动之外,十有八九的人会提到正则表达式:如果我们再问他们最头痛的是什么,可能除了复杂的进程控制和安装过程之外,还会是正则表达式.那么正则表达式到底是什么?如何才能真正的掌握正则表达式并正确的加以灵活运用?本文将就此展开介绍,希望能够对那些渴望了解和掌握正则表达式的读者有所助益. 入门简介 简单的说,正则表达式是一种可以用于模式匹配和替换的强有力的工具.我们可以在几乎所有的基于UNIX系统的工具中找到

Python 正则表达式学习摘要及资料

来源:Michael_翔_ 摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2,4}? 只匹配 2 个 a. ^表示行的开头,^\d表示必须以数字开头. $表示行的结束,\d$表示必须以数字结束. 你可能注意到了,py也可以匹配'python'–>py; 但是加上^py$就变成了整行匹配,就只能匹配'py'了,匹配'python'时,就什么也得不到

正则表达式学习参考

正则表达式学习参考 1       概述 正则表达式(Regular Expression)是一种匹配模式,描述的是一串文本的特征. 正如自然语言中“高大”.“坚固”等词语抽象出来描述事物特征一样,正则表达式就是字符的高度抽象,用来描述字符串的特征. 正则表达式(以下简称正则,Regex)通常不独立存在,各种编程语言和工具作为宿主语言提供对正则的支持,并根据自身语言的特点,进行一定的剪裁或扩展. 正则入门很容易,有限的语法规则很容易掌握,但是目前正则的普及率并不高,主要是因为正则的流派众多,各种

pyqt学习基础 4 -插曲- python 正则表达式学习

python 正则表达式学习 资源来自 学习资源来自ubuntu wiki 正则表达式介绍 正则表达式,各种语言都有相关的库.就其本质而言,正则表达式(或 RE)是一种小型的.高度专业化的编程语言 简单模式 字符匹配 _大多数_字母和字符一般都会和自身匹配.例如,正则表达式 test 会和字符串"test"完全匹配. 正则表达式使用一些元字符来帮助字符匹配: . ^ $ * + ? { [ ] \ | ( ) "[" 和 "]" "[&

Js正则表达式学习之test和compile的简单介绍

RegExp 对象用于规定在文本中检索的内容. 定义 RegExp RegExp 对象用于存储检索模式. 通过 new 关键词来定义 RegExp 对象.以下代码定义了名为 patt1 的 RegExp 对象,其模式是 "e": test方法如下 var patt1=new RegExp("e"); RegExp 对象有 3 个方法:test().exec() 以及 compile(). patt1.test("the best things in lif

正则表达式学习笔记系列----1

正则表达式是一种字符模式,在匹配文本文件的内容的时候,使用一组特殊的符号,匹配出我们想要的内容. 为什么用正则表达式 搜索(匹配)出我们想要的看到的精简的内容. 正则表达式的元字符: 元字符 功能 样例 匹配样例 ^       行首定位符           /^root/ 匹配以root开头的行 $         行尾定位符           /bash$/ 匹配以bash结尾的行 .         匹配单个字符       /l.ve/ 匹配love,live等等,在l和v中间有一个

PHP中正则表达式学习及应用(四)

正则表达式在PHP中的应用 1.匹配功能 2.替换功能 3.分割功能 例如: <?php $str="addsds{title}hfksjd{author}hfjdkjd{conn}jdskd"; $mode="/{(.*)}/U"; preg_match_all($mode,$str,$arr); print_r($arr); ?> 输出: Array ( [0] => Array ( [0] => {title} [1] => {a

JavaScript正则表达式学习笔记之一 - 理论基础

自从年前得空写了两篇文章之后就开始忙了,这一忙就是2个月??.当时信誓旦旦说的定期写篇博客的计划也就泡汤了??,不过好在最近有空,顺便总结一下这两个月遇到的几个问题.第一个问题就是项目中用到了一些正则才发现之前被自己忽略的正则是时候补一补了.恰逢今天周六??,就把自己学习JavaScript正则表达式的笔记整理成文,写了这篇关于正则表达式理论基础的文章,希望本文能对有需要的同学提供帮助.号外:本文相对基础,大神请忽略??. 一. 基本概念 正则表达式是用于匹配字符串中字符组合的模式. 一种几乎可