从正则表达式的iUs说说模式修正符

本想做个简单的采集程序,发现被抓页面代码的规律后发现抓下来的内容没有放到一个数组中,而是放在一个元素中,无奈找遍资料发现在正则表达式后加上”/iUs”后竟然可以了。

网上关于iUs的说明多数都是抄袭的,没有做过多的解释,对于一个小学毕业证是买来的人来说是在是不好理解。不过幸亏Google让我找到答案。

“iUs” 在这里叫“模式修正符”。模式修正符其实就是几个字母,可以一次使用一个也可以一次使用多个,每一个都具有一定的意义,模式修正符是对正则表达式的扩展;“/模式修正符”,其中正斜线“/”为边界符。下表列出来有那些模式修正符:

模式修正符 说明
i 表示在和模式进行匹配进不区分大小写
m 将模式视为多行,使用^和$表示任何一行都可以以正则表达式开始或结束
s 如果没有使用这个模式修正符号,元字符中的”.”默认不能表示换行符号,将字符串视为单行
x 表示模式中的空白忽略不计
e 正则表达式必须使用在preg_replace替换字符串的函数中时才可以使用(讲这个函数时再说)
A 以模式字符串开头,相当于元字符^
Z 以模式字符串结尾,相当于元字符$
U 正则表达式的特点:就是比较“贪婪”,使用该模式修正符可以取消贪婪模式

1,模式修正符m。

<?php
$pattern = ‘/^abc/m’;
$string = ‘bcd
abc
cba’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

匹配结果是成功的。注意:我们在使用模式修正符m的时候,将匹配字符串看成是多行而不是默认的单行,所以任何一行只要是以abc开头,就匹配成功。但是,如果能匹配的行前面有空格的话,就不能匹配了!除非修改正则表达式的匹配模式。

2,模式修正符s。

<?php
$pattern = ‘/a.*c/s’;
$string = ‘adsadsa
c’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

这次的匹配记过也是成功的。如果你将上例中的模式修正符s去掉的话,匹配就会失败。因为模式修正符s将匹配字符串看作是单行的,所以这个时候,元字符中的”.”就可以表示换行符号了。

3,模式修正符x。

<?php
$pattern = ‘/a c/x’;
$string = ‘a c’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

这次的匹配结果是失败的。因为我们使用模式修正符x取消了模式中的空格。注意:我们无法使用模式修正符取消\s表示的空白。

4,模式修正符A。

<?php
$pattern = ‘/ac/A’;
$string = ‘acahgyghvbm’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

正则表达式表示的含义是匹配以ac开头的字符串,结果成功。

模式修正符Z表示的是以字符串结尾的匹配,和A的用法是一样的,我们不再进行演示。

5,模式修正符U。

这个模式修正符是十分重要的!在正则表达式中,其本身是“贪婪”的。那什么是贪婪模式呢?贪婪模式的意思就是说,正则表达式默认会在查找到第一个匹配后,继续尝试后面的匹配,如果能找到匹配,则匹配最大的范围字符串。但有的时候这并不是我们想要的结果,所以我们需要取消贪婪模式。

我们还是先看一个贪婪模式的例子:

<?php
$pattern = ‘/<b>.*<\/b>/’;
$string = ‘<b>welcome</b> <b>to</b> <b>phpfuns</b>’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

这个实例的本意是匹配welcome,但是结果却匹配了welcome to phpfuns整个字符串(注意我们的字符串’welcome to phpfuns’,其开头和结尾正好构成了正则表达式的模式匹配,所以匹配成功),这就是正则表达式的贪婪模式。当然,这不是我们要的结果。

取消贪婪模式

我们可以使用模式修正符U和元字符?两种方式取消正则表达式的贪婪模式。

模式修正符U取消贪婪模式

<?php
$pattern = ‘/<b>.*<\/b>/U’;
$string = ‘<b>welcome</b> <b>to</b> <b>phpfuns</b>’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

元字符?取消贪婪模式

<?php
$pattern = ‘/<b>.*?<\/b>/’;
$string = ‘<b>welcome</b> <b>to</b> <b>phpfuns</b>dsadsadas’;
if (preg_match($pattern, $string, $arr)) {
echo “正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>”;
print_r($arr);
} else {
echo “<font color=’red’>正则表达式{$pattern}和字符串{$string}匹配失败</font>”;
}
?>

注意元字符的位置,我们必须在“”之前结束贪婪模式,才能达到我们的目的

时间: 2024-08-07 08:39:14

从正则表达式的iUs说说模式修正符的相关文章

正则表达式中常用的模式修正符有i、g、m、s、x、e详解

正则表达式中常用的模式修正符有i.g.m.s.x.e等.它们之间可以组合搭配使用. 它们的作用如下: //修正符:i 不区分大小写的匹配; //如:"/abc/i"可以与abc或aBC或ABc等匹配; //修正符:g表示全局匹配 //修正符:m 将字符串视为多行,不管是那行都能匹配; 例://模式为:$mode="/abc/m"; //要匹配的字符串为:$str="bcefg5e\nabcdfe" //注意其中\n,换行了;abc换到了下一行;

正则表达式中模式修正符作用详解(i、g、m、s、x、e)

正则表达式中常用的模式修正符有i.g.m.s.x.e等.它们之间可以组合搭配使用. 它们的作用如下: //修正符:i 不区分大小写的匹配; //如:"/abc/i"可以与abc或aBC或ABc等匹配; //修正符:g表示全局匹配 //修正符:m 将字符串视为多行,不管是那行都能匹配; 例://模式为:$mode="/abc/m";          //要匹配的字符串为:$str="bcefg5e\nabcdfe"              //

正则表达式模式修正符

模式修正符号在正则表达式定界符之外使用(最后一个斜线“/”之后),例如“php/i”.其中“/php/”是一个正则表达式的模式,而“i”就是修正此模式所使用的修正符号,用来匹配时不区分大小写.模式修正符可以调整正则表达式的解释,扩展了正则表达式在匹配.替换等操作时的某些功能,而且模式修正符号也可以组合使用,更增强了正则表达式的处理能力.例如“/php/Uis”则是使用“U”.“i”和“s”三个模式修正符组合在一起使用.模式修正符对编写简洁而简小的表达式大有帮助,在下面的表格中,列出了一些常用的模

正则表达式模式修正符 比如/esi

正则表达式模式修正符 比如/esi 作者: 字体:[增加 减小] 类型:转载 下面列出了当前在 PCRE 中可能使用的修正符.括号中是这些修正符的内部 PCRE 名.修正符中的空格和换行被忽略,其它字符会导致错误. 说明 下面列出了当前在 PCRE 中可能使用的修正符.括号中是这些修正符的内部 PCRE 名.修正符中的空格和换行被忽略,其它字符会导致错误. i (PCRE_CASELESS) 如果设定此修正符,模式中的字符将同时匹配大小写字母. s(PCRE_DOTALL) 如果设定了此修正符,

正则 模式修正符

模式修正符 说明 i 表示在和模式进行匹配进不区分大小写 m 将模式视为多行,使用^和$表示任何一行都可以以正则表达式开始或结束 s 如果没有使用这个模式修正符号,元字符中的"."默认不能表示换行符号,将字符串视为单行 x 表示模式中的空白忽略不计 e 正则表达式必须使用在preg_replace替换字符串的函数中时才可以使用(讲这个函数时再说) A 以模式字符串开头,相当于元字符^ Z 以模式字符串结尾,相当于元字符$ U 正则表达式的特点:就是比较"贪婪",使用

正则表达式——模式修正符

# re.Istring忽略大小写string1 = "HeLLO word"pattern2 = re.compile(r"hello",re.I)rett = pattern2.search(string1)print(rett.group())#输出结果:HeLLO # re.S视为单行模式string2 = """<div>别国风光,千里冰封,万里雪飘望长城内外,惟余莽莽,大河上下,顿失滔滔</div>&

PHP正则表达式模式修饰符详解

PHP模式修饰符又叫模式修正符,是在正则表达式的定界符之外使用.主要用来调整正则表达式的解释,提扩展了正则表达式在匹配.替换等操作的某些功能,增强了正则的能力.但是有很多地方的解释都是错误的,也容易误导别人,所以今天我把这个文档整理出来,供大家参考. 模式修正符号 功能描述 i 在和正则匹配是不区分大小写 m 将字符串视为多行.默认的正则开始“^”和结束“$”将目标字条串作为一单一的一“行”字符(甚至其中包括换行符也是如此).如果在修饰符中加上“m”,那么开始和结束将会指点字符串的每一行的开头就

关于php正则表达式模式修饰符

一直以来,以为自己的正则表达式学的还算可以(基本工作上遇到的问题都能解决),但有时候却是知其然而不知其所以然,在网上看到这篇文章,解释了之前的很多疑问,记录下来,随时温故而知新. i (PCRE_CASELESS) 如果设置了这个修饰符, 模式中的字母会进行大小写不敏感匹配. m (PCRE_MULTILINE) 默认情况下, PCRE认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), "行首"元字符(^)仅匹配字符串的开始位置, 而"行末"元字符($

正则表达式模式修饰符

下面列出了当前可用的 PCRE 修饰符.括号中提到的名字是 PCRE 内部这些修饰符的名称. 模式修饰符中的空格,换行符会被忽略,其他字符会导致错误. i (PCRE_CASELESS) 如果设置了这个修饰符,模式中的字母会进行大小写不敏感匹配. m (PCRE_MULTILINE) 默认情况下,PCRE 认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), "行首"元字符 (^) 仅匹配字符串的开始位置, 而"行末"元字符 ($) 仅匹配字符串末尾,