php中的字符串和正则表达式

一、字符串类型的特点

1、PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作。

1: <?php

//输出345
//输出345
//先查找hello常量,若没找到,将hello看做字符串使用
    2、字符串可以作为“数组”,是字符的集合。

1: <?php

   3: echo $str[0];
   5: echo $str[2];
          但是字符串不是真的数组,不能使用数组的函数.如count($str)不会返回字符串长度。PHP引擎无法区分字符和数组,产生二义性。自PHP4起,已经用花括号替代方括号。

1: <?php

   3: $str = "www.ido321.com";
   5: echo $str{1};
   7: ?>

3、双引号变量解析

在PHP中,当用双引号或者定界符定义字符串时,其中的变量会被解析。

1: <?php

"dwqs",‘add‘ => "www.ido321.com");
//可以解析,但是在方括号中不能使用引号
   5: echo "{$arr[‘name‘]}";  //可以解析,用花括号包含元素,name不带引号也是可以的
   7: //假设存在对象$square
; //可以解析
; //不可以解析,用花括号解决
; //可以解析
 

二、字符串输出函数

三、常用的字符串格式函数

PS:PHP的字符串处理函数大部分不对源字符串做修改,而是返回新的字符串

四、正则表达式

正则表达式描述了一种字符串匹配的模式,通过这个模式在特定的函数中对字符串进行匹配、查找、替换和分隔等操作,由原子、元字符和模式修正符三部分组成的文字模式。

在PHP中,有两套正则的处理函数库:PCRE和POSIX。前者以preg_前缀命名,与Perl兼容;后者以ereg_前缀命名。二者功能相似,但PCRE的效率略高。

与Perl语言兼容的正则表达式处理函数:

1、语法

1.1  定界符:在与Perl兼容的正则函数中使用模式时,必须给模式加上定界符。除了字母、数字和反斜线(\)之外的任何字符都可以作为定界符号

1: <?php

   3: echo $m1 = ‘/<\/\w+/‘;
   5: echo $m3 = ‘!^(?i)php[34]!‘;
   7: ?>

1.2  原子:原子包含了普通字符,如字母、数字;非打印字符,如空格、回车;特殊字符和元字符,如引号、*、+等,必须用”\”进行转义;自定义原子表,如[apj]、[a-z];通用字符类型,如\d、\D。

1: <?php

   3: $mail1 = ‘/^[0-9a-zA-Z][email protected][0-9a-zA-Z]+(\.[0-9a-zA-Z]+){0,3}$/‘;
   5: ?>

1.3  元字符:用于构建正则表达式的具有特殊含义的字符。Perl可以使用各种元字符来搜索匹配,如*、+、?.常见的元字符如下

1.4  模式修正符:在正则的定界符之外使用,扩展正则在匹配、替换等方面的功能。

2.与Perl兼容的正则表达式函数

2.1  preg_match(string pattern,string subject[,array matches]):用于对字符串的查找和匹配。参数说明:

pattern是正则,subject是需要处理的字符串,可选的matches用于保存于pattern的各个子模式的匹配结果,matches[0] 保存了与pattern匹配的整体内容,matches[1]保存了pattern中第一个小括号中匹配的内容,以此类推。

1: <?php

);
   4: $subject = "我的博客:http://www.ido321.com";
   6:     echo "搜索的URL是:".$matches[0]."<br/>";  //数组第1个元素保存整个匹配结果
;//数组第2个元素保存第1个字表达式
;//数组第3个元素保存第2个字表达式
;//数组第4个元素保存第3个字表达式
;//数组第5个元素保存第4个字表达式
  12: ?>

结果

preg_match_all()与preg_match()函数类似,不同的是前者会一直匹配到字符串末尾,后者在第一次匹配后就停止匹配。

2.2  preg_grep(string pattern,array iput):匹配数组中的元素,返回与正则匹配的数组单元。参数说明:

pattern是正则,input是需要匹配的数组。

1: <?php

   3: $version = preg_grep(‘/^[a-zA-Z]+(\d|\.)+$/‘,$arr);
   5: //输出:Array([1]=>Apache2.2.9 [2]=>MySQL5.0.51 [3]=>PHP5.2.6)
   7: ?>

2.3  preg_replace(mixed pattern,mixed replacement,mixed subject[,int limit]):字符串替换。说明:

该函数会在subject中搜索与pattern的匹配项,并用replacement替换。limit用于限制匹配的次数,即替换的次数。

1: <?php

   3: $text = ‘这个文本有<b>粗体</b>和<u>带有下划线</u>以及<i>斜体</i>‘;
//将所有HTML标记替换为空
//值替换前2个HTML标记
              2.4  preg_split(string pattern,string subject[,int limit[,int flags]]):对字符串进行分割。说明:

函数返回一个数组。数组元素包含subject中与pattern匹配作为边界所分割的字符串,limit含义见2.3,flags含义请参考文档。

   2: //按任数量的空格分割字符串
   4:  
   6: print_r($kerwords);
来源:http://www.ido321.com/612.html
时间: 2024-11-25 06:35:28

php中的字符串和正则表达式的相关文章

java 中的字符串处理--正则表达式

最近在做一些支付报文处理工作,需要从各种各样的报文中提取需要的信息比如(金额,订单号...),每个渠道报文各式各样,想要写一个通用的提取逻辑,于是就回顾java正则表达式的用法.当然我们可以自己写一些算法,去提取这些字段,但对于简单的解析来说,亲自手写算法有点杀鸡用牛刀的感觉,而且正则表达式完全可以满足大部分的字符提取需求.好了闲话不多说,先列出正则表达式的常用语法: \:表示下一个字符为特殊含义的字符例如:\d匹配数字 ^:表示匹配字符开始的位置例如:^#.*:匹配以#开头的所有字符 $:表示

Ruby中字符串与正则表达式的问题

Ruby的正则表达式为Regexp类的对象 主要的元语言字符 記号 意味 例 説明 ^ 行頭 /^abc/ abcで始まる行 $ 行末 /abc$/ abcで終わる行 . 任意の1文字 /a.b/ aとbの間に1文字 [...] []内のいずれか1文字 /[A-Za-z]/ 英字 [^...] []内に含まれない1文字 /[^0-9]/ 数字以外 * 0回以上の繰り返し /a.*/ aまたはaで始まる + 1回以上の繰り返し /a+/ 1回以上のaの繰り返し ? 0回または1回 /aa?/ aま

如何使用 awk 和正则表达式过滤文本或文件中的字符串

当我们在 Unix/Linux 下使用特定的命令从字符串或文件中读取或编辑文本时,我们经常需要过滤输出以得到感兴趣的部分.这时正则表达式就派上用场了. 什么是正则表达式? 正则表达式可以定义为代表若干个字符序列的字符串.它最重要的功能之一就是它允许你过滤一条命令或一个文件的输出.编辑文本或配置文件的一部分等等. 正则表达式的特点 正则表达式由以下内容组合而成: 普通字符,例如空格.下划线.A-Z.a-z.0-9. 可以扩展为普通字符的元字符,它们包括: (.) 它匹配除了换行符外的任何单个字符.

Python字符串和正则表达式中的反斜杠(&#39;\&#39;)问题

在Python普通字符串中 在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如 In [1]: print('abc\ndef') # '\n'具有换行的作用 abc defg In [2]: print('abc\tdef') # '\t'具有制位符的作用 abc defg 我们还可以用'\'来转义特殊字符,使其成为普通字符,比如 In [3]: print('abc\\tdef') # 使'\'成为一个普通的字符,没有转义作用 abc\tdef In [4]: prin

Python基础要点:字符串和正则表达式中的反斜杠(‘\‘)问题详解

给大家整理的是关于Python字符串和正则表达式中的反斜杠('\')问题以及相关知识点,有需要的朋友们可以学习下. 在Python普通字符串中 在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如 1 In [1]: print('abc\ndef') # '\n'具有换行的作用 2 abc 3 defg 4 5 In [2]: print('abc\tdef') # '\t'具有制位符的作用 6 abc defg 我们还可以用'\'来转义特殊字符,使其成为普通字符,比如 1

Python学习笔记5(字符串与正则表达式)

1.字符串 1.1字符串的格式化 #格式化语法 "%s" % str1 "%s %s" % (str1,str2) #格式化字符串 str1 = "version" num = 1.0 format = "%s" % str1 print (format) format = "%s %d" %(str1, num) print (format) #使用字典格式化字符串 print ("%(vers

iOS中的过滤器和正则表达式(NSPredicate,NSRegularExpression)

参考链接:http://www.cocoachina.com/industry/20140321/8024.html NSPredicate Cocoa提供了一个NSPredicate类,它用来指定过滤器的条件 初始化方法 + (NSPredicate *)predicateWithFormat:(NSString *)predicateFormat, ...; Format: /** 1.格式说明符 %d和%@等插入数值和字符串,%K表示key 还可以引入变量名,用$,类似环境变量,如:@"n

【转】字符串和正则表达式

System.String是一个功能非常强大且用途非常广泛的基类,但它不是.NET中唯一与字符串相关的类,特别是System.Text和System.Text.RegularExpressions命名空间中的类.本文主要介绍内容: 1.创建字符串 2.格式化表达式 3.正则表达式一.System.String类 System.String是一个类,专门用于存储字符串,允许对字符串进行许多操作. 例如: string messsage1 = "Hello"; // return &quo

javascript中对字符串的操作总结

没听过一句话吗?程序员的世界,不处理字符串就是处理数组.这是群里的一位前辈和我说的,显然这和我之前理解的DOM是javascript的核心的不同的,看了几个面试题的内容,感觉前辈说的话非常的有道理,因此总结下,javascript中对字符串的操作. String类型 首先字符串类型是基本类型,但是在这里我们所说的是字符串的对象包装类型.因为只有引用类型才会有属性和方法.实际上每读取一个基本类型的同时都会创建一个对应的基本包装类型,从而让我们能够调用一些方法来操作数据.1.charAt() 和 c