Java正则表达式Pattern和Matcher类

转载自--小鱼儿是坏蛋(原文链接

概述

Pattern类的作用在于编译正则表达式后创建一个匹配模式.
    Matcher类使用Pattern实例提供的模式信息对正则表达式进行匹配

Pattern类
常用方法及介绍

1.  Pattern complie(String regex)
    由于Pattern的构造函数是私有的,不可以直接创建,所以通过静态方法compile(String regex)方法来创建,将给定的正则表

达式编译并赋予给Pattern类

2.  String pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数

例,
String regex = "\\?|\\*";
Pattern pattern = Pattern.compile(regex);
String patternStr = pattern.pattern();//返回\?\*

3.  Pattern compile(String regex, int flags) 方法功能和compile(String regex)相同,不过增加了flag参数

int flags() 返回当前Pattern的匹配flag参数.
    flag参数用来控制正则表达式的匹配行为,可取值范围如下:

Pattern.CANON_EQ 当且仅当两个字符的”正规分解(canonical decomposition)”都完全相同的情况下,才认定匹配.比如
用了这个标志之后,表达式”a\u030A”会匹配”?”.默认情况下,不考虑”规范相等性(canonical equivalence)”.

Pattern.CASE_INSENSITIVE(?i) 默认情况下,大小写不明感的匹配只适用于US-ASCII字符集.这个标志能让表达式忽略大小
写进行匹配.要想对Unicode字符进行大小不明感的匹 配,只要将UNICODE_CASE与这个标志合起来就行了.

Pattern.COMMENTS(?x) 在这种模式下,匹配时会忽略(正则表达式里的)空格字符(译者注:不是指表达式里的”\s”,而是指
表达式里的空格,tab,回车之类).注释从#开始,一直到这行结束.可以通过嵌入式的标志来启用Unix行模式.

Pattern.DOTALL(?s)在这种模式下,表达式’.’可以匹配任意字符,包括表示一行的结束符。默认情况下,表达式’.’不
匹配行的结束符.

Pattern.MULTILINE(?m)在这种模式下,’\^’和’$’分别匹配一行的开始和结束.此外,’^’仍然匹配字符串的开始,’$’
也匹配字符串的结束.默认情况下,这两个表达式仅仅匹配字符串的开始和结束.

Pattern.UNICODE_CASE(?u) 在这个模式下,如果你还启用了CASE_INSENSITIVE标志,那么它会对Unicode字符进行大小写不明
感的匹配.默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集.

Pattern.UNIX_LINES(?d) 在这个模式下,只有’\n’才被认作一行的中止,并且与’.’,’^’,以及’$’进行匹配.

4.  Pattern.matcher(CharSequence input) 对指定输入的字符串创建一个Matcher对象

例,
Pattern pattern = Pattern.compile("\\?{2}");
Matcher matcher = pattern.matcher("??");
boolean matches = matcher.matches();// true

5.  String[] split(CharSequence input)
    String[] split(CharSequence input, int limit)
    功能和String[] split(CharSequence input)相同,增加参数limit目的在于要指定分割的段数

例,
String regex = ",";
Pattern pattern = Pattern.compile(regex);
//这里必须用数组形式,因为split分割后默认保存为数组
String[] splitStrs = pattern.split("123,123,456,456");//123 123 456 456
String[] splitStrs2 = pattern.split("123,123,456,456", 2);// 123 123,456,456

6.  Pattern.quote(String s) 返回给定的字符串的字面量,关于方法的具体信息请参考123
例,
String pattern = Pattern.quote("1252343% 8 567 hdfg gf^$545");
System.out.println("Pattern is : "+pattern);

输出信息:
Pattern is : \Q1252343% 8 567 hdfg gf^$545\E

7.  matches()方法编译给定的正则表达式并且对输入的字串以该正则表达式为模开展匹配,该方法适合于该正则表达式只会使用一次的情况,也就是只进行一次匹配工作,因为这种情况下并不需要生成一个Matcher实例.

例,
String regex = "\\?|\\*";
Pattern pattern = Pattern.compile(regex);
boolean matches = pattern.matches(regex, "?");//返回true

*******************************************
Matcher类
常用方法及介绍

1.  boolean matches() 最常用方法:尝试对整个目标字符展开匹配检测,也就是只有整个目标字符串完全匹配时才返回真值.
例,
Pattern pattern = Pattern.compile("\\?{2}");
Matcher matcher = pattern.matcher("??");
boolean matches = matcher.matches();//true
System.out.println(matches);
matcher=pattern.matcher("?");
matches = matcher.matches();//false
System.out.println(matches);

2.  boolean lookingAt() 对前面的字符串进行匹配,只有匹配到的字符串在最前面才会返回true
例,
Pattern p = Pattern.compile("\\d+");
Matcher m = p.matcher("22bb23");
boolean match = m.lookingAt();//true
System.out.println(match);
m = p.matcher("bb2233");
match= m.lookingAt();
System.out.println(match);//false

3. boolean find() 对字符串进行匹配,匹配到的字符串可以在任何位置
例,
Pattern p = Pattern.compile("\\d+");
Matcher m = p.matcher("22bb23");
m.find();// 返回true
Matcher m2 = p.matcher("aa2223");
m2.find();// 返回true
Matcher m3 = p.matcher("aa2223bb");
m3.find();// 返回true
Matcher m4 = p.matcher("aabb");
m4.find();// 返回false

4.  int start() 返回当前匹配到的字符串在原目标字符串中的位置
    int end() 返回当前匹配的字符串的最后一个字符在原目标字符串中的索引位置.
    String group() 返回匹配到的子字符串
    Pattern.start(),Pattern.end(),Pattern.group()代码示例
注意:start(),end()和group()方法必须放在find()方法后面!!!

例,
        Pattern p=Pattern.compile("wo");
        Matcher m=p.matcher("hello,world");
        m.find();//这里必须有,不然后面的start()和group()方法会报错
        System.out.println(m.start());//6
        System.out.println(m.group());// wo

时间: 2024-11-07 23:23:39

Java正则表达式Pattern和Matcher类的相关文章

JAVA正则表达式 Pattern和Matcher

java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介:  java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher . Pattern: 一个Pattern是一个正则表达式经编译后的表现模式. Matcher: 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类

文字效果和表情图片:JAVA正则表达式 Pattern和Matcher、SpannableString与SpannableStringBuilder

在TextView和EditText加入表情或者设置文字效果可以使用: JAVA正则表达式 Pattern和Matcher SpannableString与SpannableStringBuilder

Java正则表达式Pattern和Matcher详解

java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介:  java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher . Pattern: 一个Pattern是一个正则表达式经编译后的表现模式. Matcher: 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类

Java基础知识强化78:正则表达式之获取功能(Pattern 和 Matcher类的使用)

1. 获取功能: Pattern 和 Matcher类结合使用 2. 使用案例: 1 package cn.itcast_05; 2 3 import java.util.regex.Matcher; 4 import java.util.regex.Pattern; 5 6 /* 7 * 获取功能 8 * Pattern和Matcher类的使用 9 * 10 * 模式和匹配器的基本使用顺序 11 */ 12 public class RegexDemo { 13 public static v

Java中正则表达式以及Pattern和Matcher类

正则表达式  正则表达式就是正确规则的表达式,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,就是一种规则的应用. 规则字符在java.util.regex Pattern类中字符 x 字符 x.举例:'a’表示字符a\ 反斜线字符.\n 新行(换行)符 (’\u000A’)\r 回车符 (’\u000D’)字符类 [abc] a.b 或 c(简单类)[^abc] 任何字符,除了 a.b 或 c(否定)[a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围)[0-

Java 正则表达式 Pattern&Matcher

通常会有这种需求: 在文档中搜索有规律的字符串,然后进行统计或者替换.Java.util.regex包下的Pattern和Matcher这两个类提供了通过正则表达式来匹配查询,甚至替换的功能.那么我们接下来就举个栗子吧 : 栗子1:查找文件中以img_数字.png格式的字符串,并在前面添加路径: /test/img/ package test; import java.io.File; import java.util.regex.Matcher; import java.util.regex.

正则表达式Pattern ,Matcher

正则表达式:符合一定规则的表达式 作用:用于专门操作字符串 特点:用于一些特定的符号来表示一些代码的操作,这样就简化代码的书写 学习正则表达式就是要学习一些特殊符号的使用 好处:简化对字符串复杂的操作 1. 匹配 String matches方法 2. 切割 String spilt方法 3. 替换 String repaceAll 4. 截取 将字符串中符合规则的子串取出 对QQ号进行校验 要去:5-15 0不能开头,只能是数字 String regex = "[1-9]\d{4,14}&qu

Java 后台验证的工具类

Java 后台验证的工具类 public class ValidationUtil {         //手机号     public static String mobile = "^((13[0-9])|(14[0-9])|(15[0-9])|(16[0-9])|(17[0-9])|(18[0-9])|(19[0-9]))\\d{8}$";       //不允许为空     public static String blank = ".*[^ ].*";  

14-01 Java matches类,Pattern类,matcher类

Pattern类 正则表达式常见规则 A:字符 x 字符 x.举例:'a'表示字符a \\ 反斜线字符. \n 新行(换行)符 ('\u000A') \r 回车符 ('\u000D') B:字符类 [abc] a.b 或 c(简单类),其中一个 [^abc] 任何字符,除了 a.b 或 c(否定) [a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围) [0-9] 0到9的字符都包括 C:预定义字符类 . 任何字符.我的就是.字符本身,怎么表示呢? \. \d 数字:[0-9] \