概述:
在编写处理字符串的程序时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码.
理解:
正则表达式是对字符串操作的一种逻辑公式,用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑。
使用范围:
-在很多文本编辑器里,可以使用正则表达式进行检索,Xcode同样支持正则表达式!
-几乎所有的程序设计语言都支持正则表达式,例如:OC,java,c#,python,js等。
下面用代码演示:
1. 对QQ账号的检索:
NSString *QQ = @"788990哈啊哈";
// QQ匹配规则
NSString *pattern = @"^[1-9][0-9]{5,12}";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:pattern options:0 error:nil];
//返回匹配的结果
NSTextCheckingResult *result = [regular firstMatchInString:QQ options:NSMatchingReportCompletion range:NSMakeRange(0, QQ.length)];
NSString *str = [QQ substringWithRange:result.range];
NSLog(@"QQ = %zd",result.range.length);
NSLog(@"QQ = %@",str);
2. 对电话号码的检索:
NSString *tel = @"13908493130哈jlk";
//电话号码匹配规则
NSString *pattern [email protected]"^[1][34578][0-9]{9}";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:pattern options:0 error:nil];
//返回的字符串
NSTextCheckingResult *result = [regular firstMatchInString:tel options:NSMatchingReportCompletion range:NSMakeRange(0, tel.length)];
NSString *str =[tel substringWithRange:result.range];
NSLog(@"%zd",result.range.length);
NSLog(@"%@",str);
3. 对邮箱账号的检索:
NSString *mail = @"[email protected]";
//邮箱账号规则
NSString *pattern = @"^[a-z0-9]+([._\\-]*[a-z0-9])*@([a-z0-9]+[-a-z0-9]*[a-z0-9]+.){1,63}[a-z0-9]+$";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:pattern options:0 error:nil];
//返回的结果
NSArray *arr = [regular matchesInString:mail options:NSMatchingReportCompletion range:NSMakeRange(0, mail.length)];
if (arr == nil) {
NSLog(@"没有找到匹配的结果");
}else{
NSLog(@"%zd",arr.count);
}
for (NSTextCheckingResult *result in arr) {
NSString *str = [mail substringWithRange:result.range];
NSLog(@"%zd",result.range.length);
NSLog(@"%@",str);
}
0> 匹配
--------------------------------------------------------------------------------
(pattern) 匹配pattern并获取这一匹配,所获取的匹配可以从产生的Matches集合得到
1> 常用元字符
--------------------------------------------------------------------------------
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符(空格、TAB\t、回车\r \n)
\d 匹配数字
^ 匹配字符串的开始
$ 匹配字符串的结束
\b 匹配单词的开始或结束
2> 常用反义符
--------------------------------------------------------------------------------
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
3> 集合
--------------------------------------------------------------------------------
[xyz] 字符集合
[^xyz] 负值字符集合
[a-z] 字符范围
[^a-z] 负值字符范围
4> 常用限定符
--------------------------------------------------------------------------------
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
5> 贪婪和懒惰
--------------------------------------------------------------------------------
*? 重复任意次,但尽可能少重复
*+ 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复