前端学PHP之正则表达式函数

前面的话

  正则表达式不能独立使用,它只是一种用来定义字符串的规则模式,必须在相应的正则表达式函数中应用,才能实现对字符串的匹配、查找、替换及分割等操作。前面介绍了正则表达式的基础语法,本文将详细介绍正则表达式函数

匹配与查找

【preg_match()】

  preg_match()函数用来执行一个正则表达式匹配,搜索subject与pattern给定的正则表达式的一个匹配。返回pattern的匹配次数。它的值将是0次(不匹配)或1次,因为preg_match()在第一次匹配后将会停止搜索。preg_match_all()不同于此,它会一直搜索subject直到到达结尾。如果发生错误preg_match()返回FALSE

int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )

  pattern表示要搜索的模式,字符串类型

  subject表示输入字符串

  如果提供了参数matches,它将被填充为搜索结果。matches[0]将包含完整模式匹配到的文本,matches[0]将包含完整模式匹配到的文本,matches[1] 将包含第一个捕获子组匹配到的文本,以此类推

  flags可以被设置为以下标记:1、PREG_OFFSET_CAPTURE。如果传递了这个标记,对于每一个出现的匹配返回时会附加字符串偏移量(相对于目标字符串的)。注意:这会改变填充到matches参数的数组,使其每个元素成为一个由第0个元素是匹配到的字符串,第1个元素是该匹配字符串在目标字符串subject中的偏移量;2、offset。通常,搜索从目标字符串的开始位置开始。可选参数offset用于指定从目标字符串的某个未知开始搜索(单位是字节)

<?php
//从URL中获取主机名称
preg_match(‘@^(?:http://)?([^/]+)@i‘,
    "http://www.php.net/index.html", $matches);
$host = $matches[1];

//获取主机名称的后面两部分
preg_match(‘/[^.]+\.[^.]+$/‘, $host, $matches);

//domain name is: php.net
echo "domain name is: {$matches[0]}\n";
?>

<?php
$pattern = ‘/www\.[^\.\/]+\.com/i‘;
$subject = ‘www.baidu.com,www.qq.com,www.cnblogs.com‘;
preg_match($pattern,$subject,$matches);
/*
array (size=1)
  0 => string ‘www.baidu.com‘ (length=13)
 */
var_dump($matches);
?>

【preg_match_all()】

  preg_match_all()与preg_match()类似,不同的是preg_match()在第一次匹配之后就会停止搜索,而函数preg_match_all()则会一直搜索到指定字符串的结尾,可以获取到所有匹配到的结果

int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )

<?php
$pattern = ‘/www\.[^\.\/]+\.com/i‘;
$subject = ‘www.baidu.com,www.qq.com,www.cnblogs.com‘;
preg_match_all($pattern,$subject,$matches);
/*
array (size=1)
  0 =>
    array (size=3)
      0 => string ‘www.baidu.com‘ (length=13)
      1 => string ‘www.qq.com‘ (length=10)
      2 => string ‘www.cnblogs.com‘ (length=15)
 */
var_dump($matches);
?>

【preg_grep()】

  preg_grep()返回给定数组input中与模式pattern 匹配的元素组成的数组

array preg_grep ( string $pattern , array $input [, int $flags = 0 ] )

  如果flags设置为PREG_GREP_INVERT,这个函数返回输入数组中与 给定模式pattern不匹配的元素组成的数组

<?php
$pattern = ‘/www\.[^\.\/]+\.com/i‘;
$subject = [‘baidu.com‘,‘www.qq.com‘,‘www.cnblogs.com‘];
var_dump (preg_grep($pattern,$subject));
/*
array (size=2)
  1 => string ‘www.qq.com‘ (length=10)
  2 => string ‘www.cnblogs.com‘ (length=15)
 */
?>

替换

【preg_replace()】

  preg_replace()执行一个正则表达式的搜索替换,搜索subject匹配pattern的部分,以replacement进行替换

mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )

  replacement表示用于替换的字符串或字符串数组。如果这个参数是一个字符串,并且pattern是一个数组,那么所有的模式都使用这个字符串进行替换。如果pattern和replacement都是数组,每个pattern使用replacement中对应的元素进行替换。如果replacement中的元素比pattern中的少,多出来的pattern使用空字符串进行替换

<?php
$string = ‘April 15, 2016‘;
$pattern = ‘/(\w+) (\d+), (\d+)/i‘;
$replacement = ‘${1}1,$3‘;

//April1,2016
echo preg_replace($pattern, $replacement, $string);
?>

<?php
$string = ‘The quick brown fox jumped over the lazy dog.‘;
$patterns = array();
$patterns[0] = ‘/quick/‘;
$patterns[1] = ‘/brown/‘;
$patterns[2] = ‘/fox/‘;
$replacements = array();
$replacements[2] = ‘bear‘;
$replacements[1] = ‘black‘;
$replacements[0] = ‘slow‘;

//The bear black slow jumped over the lazy dog.
echo preg_replace($patterns, $replacements, $string);
?>

【preg_replace_callback()】

  preg_replace_callback()执行一个正则表达式搜索并且使用一个回调进行替换

mixed preg_replace_callback ( mixed $pattern , callable $callback , mixed $subject [, int $limit = -1 [, int &$count ]] )

<?php
// 将文本中的年份增加一年.
$text = "April fools day is 04/01/2002\n";
$text.= "Last christmas was 12/24/2001\n";
// 回调函数
function next_year($matches)
{
  // 通常: $matches[0]是完成的匹配
  // $matches[1]是第一个捕获子组的匹配
  // 以此类推
  return $matches[1].($matches[2]+1);
}
/*
April fools day is 04/01/2003
Last christmas was 12/24/2002
 */
echo preg_replace_callback(
            "|(\d{2}/\d{2}/)(\d{4})|",
            "next_year",
            $text);

?>

【preg_filter()】

  preg_filter() 执行一个正则表达式搜索和替换,等价于preg_replace()除了它仅仅返回(可能经过转化)与目标匹配的结果

mixed preg_filter ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )

<?php
$subject = array(‘1‘, ‘a‘, ‘2‘, ‘b‘, ‘3‘, ‘A‘, ‘B‘, ‘4‘);
$pattern = array(‘/\d/‘, ‘/[a-z]/‘, ‘/[1a]/‘);
$replace = array(‘A:$0‘, ‘B:$0‘, ‘C:$0‘);
/*
Array
(
    [0] => A:C:1
    [1] => B:C:a
    [2] => A:2
    [3] => B:b
    [4] => A:3
    [7] => A:4
)
 */
print_r(preg_filter($pattern, $replace, $subject)); 

/*
Array
(
    [0] => A:C:1
    [1] => B:C:a
    [2] => A:2
    [3] => B:b
    [4] => A:3
    [5] => A
    [6] => B
    [7] => A:4
)
 */
print_r(preg_replace($pattern, $replace, $subject));
?>

分割

【preg_split()】

  preg_split()通过一个正则表达式分隔字符串

array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )

  如果指定limit,将限制分隔得到的子串最多只有limit个,返回的最后一个子串将包含所有剩余部分。limit值为-1,0或null时都代表"不限制";可以使用null跳过对flags的设置

  flags可以是任何下面标记的组合(以位或运算 | 组合):PREG_SPLIT_NO_EMPTY——如果这个标记被设置,preg_split()将进返回分隔后的非空部分;PREG_SPLIT_DELIM_CAPTURE——如果这个标记设置了,用于分隔的模式中的括号表达式将被捕获并返回;PREG_SPLIT_OFFSET_CAPTURE——如果这个标记被设置,对于每一个出现的匹配返回时将会附加字符串偏移量。注意:这将会改变返回数组中的每一个元素,使其每个元素成为一个由第0个元素为分隔后的子串,第1个元素为该子串在subject中的偏移量组成的数组

<?php
//使用逗号或空格(包含" ", \r, \t, \n, \f)分隔短语
$keywords = preg_split("/[\s,]+/", "hypertext language, programming");
/*
Array
(
    [0] => hypertext
    [1] => language
    [2] => programming
)
 */
print_r($keywords);
?>

转义

【preg_quote()】

  preg_quote()转义正则表达式字符

string preg_quote ( string $str [, string $delimiter = NULL ] )

  正则表达式特殊字符有: . \ + * ? [ ^ ] $ ( ) { } = ! < > | : -

<?php
$keywords = ‘$40 for a g3/400‘;
$keywords = preg_quote($keywords, ‘/‘);
echo $keywords; // 返回 \$40 for a g3\/400
?>
时间: 2024-12-26 21:15:51

前端学PHP之正则表达式函数的相关文章

前端学PHP之正则表达式基础语法

前面的话 正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割.匹配.查找及替换操作.在PHP中,正则表达式一般是由正规字符和一些特殊字符(类似于通配符)联合构成的一个文本模式的程序性描述.正则表达式有三个作用:1.匹配,也常常用于从字符串中析取信息:2.用新文本代替匹配文本:3.将一个字符串拆分为一组更小的信息块.本文将详细介绍PHP中的正则表达式基础语法 [注意]关于javascript的正则表达式的详细信息移步至此 历史 在PHP中有两套正则表达式函数库,两者功

前端学PHP之字符串函数

前面的话 字符串的处理和分析在任何编程语言中都是一个重要的基础,往往是简单而重要的.信息的分类.解析.存储和显示,以及网络中的数据都需要操作字符串来完成.尤其在web开发中更为重要,程序员大部分工作都是在操作字符串,本文将详细介绍php中的字符串函数 [注意]关于javascript中字符串的属性和方法移步至此 特点 因为php是弱类型语言,所以其他类型的数据一般都可以直接应用于字符串操作函数中,而自己转换成字符串类型进行处理 echo substr( "1234567", 2, 4

前端学PHP之数组函数

× 目录 [1]键值操作 [2]记数[3]回调函数[4]组合[5]栈和队列[6]顺序 前面的话 PHP中的数组功能非常强大,数组处理函数有着强大.灵活.高效的特点.PHP5提供了近100个操作数组的系统函数,包括排序函数.替换函数.数组计算函数等.下面将详细介绍数组函数 [注意]关于javascript数组的22种方法移步至此 键值操作 数组的每个元素都是由键值对组成,通过元素的键名来访问对应的键值.关于键值操作有array_values().array_keys().in_array().ar

前端入门12-JavaScript语法之函数

声明 本系列文章内容全部梳理自以下几个来源: <JavaScript权威指南> MDN web docs Github:smyhvae/web Github:goddyZhao/Translation/JavaScript 作为一个前端小白,入门跟着这几个来源学习,感谢作者的分享,在其基础上,通过自己的理解,梳理出的知识点,或许有遗漏,或许有些理解是错误的,如有发现,欢迎指点下. PS:梳理的内容以<JavaScript权威指南>这本书中的内容为主,因此接下去跟 JavaScrip

&lt;转&gt;PHP中正则表达式函数

PHP中的正则表达式函数 在PHP中有两套正则表达式函数库.一套是由PCRE(Perl Compatible Regular Expression)库提供的,基于传统型NFA.PCRE库使用和Perl相同的语法规则实现了正则表达式的模式匹配,其使用以"preg_"为前缀命名的函数.另一套是由POSIX(Portable Operation System interface)扩展库提供的,基于POSIX NFA.POSIX扩展的正则表达式由POSIX 1003.2定义,一般使用以&quo

php正则表达式函数

1.int preg_match ( string pattern, string subject [, array matches [, int flags]] ) 在subject字符串中搜索与pattern给出的正则表达式相匹配的内容. 如果提供了matches则其会被搜索的结果所填充.$matches[0]将包含与整个模式匹配的文本,$matches[1]将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推. 提示: 如果只想查看一个字符串是否包含在另一个字符串中,不要用 preg_

跟王老师学MySQL:集合函数

跟王老师学MySQL:集合函数 主讲教师:王少华   QQ群号:483773664 学习内容 COUNT().SUM().AVG().MAX()和MIN()四个集合函数的使用 集合函数包括COUNT().SUM().AVG().MAX()和MIN(). 一.count() (一)简介 COUNT()函数用来统计记录的条数. (二)举例 使用count()函数统计employee表的记录数 1 SELECT  COUNT(*)  FROM  employee ; 二.SUM()函数 (一)简介 S

与Perl兼容的正则表达式函数

正则表达式不能独立使用,它只是一种用来定义字符串的规则模式,必须在相应的正则表达式函数中应用,才能实现对字符串的匹配.查找.替换及分割等操作.前面也介绍过在PHP中有两套正则表达式函数库,而使用与Perl兼容的正则表达式函数库的执行效率要略占优势,所以在本书中主要介绍以“preg_”开头的正则表达式函数.另外,在处理大量信息时,正则表达式函数会使速度大幅减慢,应当只在需要使用正则表达式解析比较复杂的字符串时才使用这些函数.如果要解析简单的表达式,还可以采用很多可以显著加快处理过程的预定义函数.下

Oracle正则表达式函数:regexp_like、regexp_substr、regexp_instr、regexp_replace

Oracle正则表达式函数:regexp_like.regexp_substr.regexp_instr.regexp_replace --去掉所有特殊字符,只剩字母 SELECT REGEXP_REPLACE('(Sam-Tomats123-=,.231+)','[^[:alpha:]]','') FROM dual; Sql代码 Oracle使用正则表达式离不开这4个函数: 1.regexp_like 2.regexp_substr 3.regexp_instr 4.regexp_repla