正則表達式及应用

一、 正則表達式

(一)、概念:

????????正則表達式(regular expression)就是由普通字符(比如a到z)以及特殊字符(称为元字符)组成的一种字符串匹配的模式,能够用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

(二)、正則表達式中主要元字符:【当中经常使用的元字符用红色标出,红色的元字符必须掌握。难点用蓝色标出,难点在一般的应用中并不经常使用】



  1. \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。

    比如。‘n‘匹配字符 "n"。‘\n‘
    (newline)匹配一个换行符。序列 ‘\\‘ 匹配 "\" 而"\(" 则匹配 "("。 ‘\r’ (return)

  2. ^ 匹配输入字符串的開始位置。假设设置了 RegExp 对象的 Multiline 属性。^ 也匹配‘\n‘ 或 ‘\r‘
    之后的位置。
  3. $ 匹配输入字符串的结束位置。

    假设设置了RegExp 对象的 Multiline 属性。$ 也匹配‘\n‘ 或 ‘\r‘
    之前的位置。

  4. * 匹配前面的子表达式零次或多次。比如,zo*
    能匹配"z" 以及 "zoo"。* 等价于{0,}。
  5. + 匹配前面的子表达式一次或多次。比如,‘zo+‘
    能匹配 "zo" 以及"zoo",但不能匹配 "z"。+ 等价于 {1,}。
  6. ?

    匹配前面的子表达式零次或一次。比如。"do(es)?"
    能够匹配 "do" 或"does" 中的"do" 。?

    等价于 {0,1}。

  7. {n} n 是一个非负整数。

    匹配确定的 n 次。

    比如,‘o{2}‘ 不能匹配"Bob" 中的 ‘o‘。可是能匹配 "food"
    中的两个o。

  8. {n,} n 是一个非负整数。

    至少匹配n 次。比如,‘o{2,}‘ 不能匹配"Bob" 中的 ‘o‘,但能匹配 "foooood"
    中的全部o。

    ‘o{1,}‘ 等价于 ‘o+‘。‘o{0,}‘ 则等价于‘o*‘。

  9. {n,m} m 和 n 均为非负整数。当中n <= m。

    最少匹配 n 次且最多匹配 m次。比如。"o{1,3}" 将匹配
    "fooooood" 中的前三个o。

    ‘o{0,1}‘ 等价于 ‘o?‘。请注意在逗号和两个数之间不能有空格。

  10. ?
    当该字符紧跟在不论什么一个其它限制符 (*, +, ?, {n}, {n,}, {n,m})后面时,匹配模式是非贪婪的。

    非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。比如,对于字符串"oooo",‘o+?‘
    将匹配单个 "o",而 ‘o+‘将匹配全部 ‘o‘。

  11. 点“.
    ” 匹配除 "\n"之外的不论什么单个字符。要匹配包括 ‘\n‘在内的不论什么字符。请使用象 ‘[.\n]‘ 的模式。
  12. x|y 匹配 x 或 y。“|”代表“或”的意思。比如,‘z|food‘能匹配
    "z" 或 "food"。

    ‘(z|f)ood‘ 则匹配"zood" 或 "food"。

  13. [xyz] 字符集合。匹配所包括的随意一个字符。

    比如, ‘[abc]‘ 能够匹配"plain" 中的 ‘a‘。

  14. [^xyz] 负值字符集合。匹配未包括的随意字符。比如, ‘[^abc]‘ 能够匹配"plain" 中的‘p‘。
  15. [a-z] 字符范围。

    匹配指定范围内的随意字符。比如,‘[a-z]‘ 能够匹配 ‘a‘到 ‘z‘ 范围内的随意小写字母字符。

  16. [^a-z]负值字符范围。匹配不论什么不在指定范围内的随意字符。比如,‘[^a-z]‘ 能够匹配不论什么不在 ‘a‘ 到‘z‘ 范围内的随意字符。
  17. \b匹配一个单词边界。也就是指单词和空格间的位置。

    比如, ‘er\b‘ 能够匹配"never" 中的‘er‘。但不能匹配 "verb" 中的 ‘er‘。

  18. \B匹配非单词边界。‘er\B‘ 能匹配 "verb" 中的 ‘er‘,但不能匹配"never" 中的 ‘er‘。
  19. \cx匹配由 x 指明的控制字符。比如。 \cM 匹配一个 Control-M 或回车符。

    x 的值必须为 A-Z 或 a-z 之中的一个。否则,将c 视为一个原义的 ‘c‘ 字符。

  20. \d 匹配一个数字字符。等价于 [0-9]。 digital
  21. \D 匹配一个非数字字符。

    等价于 [^0-9]。

  22. \f匹配一个换页符。等价于 \x0c 和 \cL。
  23. \n 匹配一个换行符。

    等价于 \x0a 和 \cJ。

  24. \r 匹配一个回车符。

    等价于 \x0d 和 \cM。

  25. \s 匹配不论什么空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

    (space)

  26. \S匹配不论什么非空白字符。等价于 [^ \f\n\r\t\v]。
  27. \t匹配一个制表符。等价于 \x09 和 \cI。
  28. \v匹配一个垂直制表符。

    等价于 \x0b 和 \cK。

  29. \w 匹配包括下划线的不论什么单词字符。

    等价于‘[A-Za-z0-9_]‘。
    word

  30. \W匹配不论什么非单词字符。等价于 ‘[^A-Za-z0-9_]‘。
  31. \num匹配 num,当中 num 是一个正整数。对所获取的匹配的引用。比如,‘(.)\1‘匹配两个连续的同样字符。

  32. \xn匹配 n。当中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。

    比如。‘\x41‘ 匹配"A"。‘\x041‘
    则等价于 ‘\x04‘ &"1"。

    正則表達式中能够使用 ASCII 编码。

  33. \un匹配 n。当中 n 是一个用四个十六进制数字表示的 Unicode 字符。比如, \u00A9 匹配版权符号(?

    )。

  34. ?(pattern)匹配
    pattern 并获取这一匹配。所获取的匹配能够从产生的 Matches 集合得到,在VBScript 中使用SubMatches 集合,在JScript 中则使用 $0…$9 属性。要匹配圆括号字符,请使用 ‘\(‘ 或‘\)‘。
  35. (?=pattern)?正向预查。比如windows(?

    =95/98/2000/NT)。含义是匹配“windows”后面能够是“95”“98”“2000”或者“NT”。

    ?

  36. (?!pattern)?负向预查。例windows(?!95/98),含义是匹配“windows”后面不是“95”或“98”的其它字符串。

? ?

(三)、图解正則表達式:

?


匹配全部Moth DD,YYYY格式的日期

匹配全部Month DD,YYYY格式的日期,定义月份值为第一个组

匹配全部123-12-1234格式的社会安全号码

匹配IP地址

\d{1,3}\.\d{1,3}\.

匹配FONT标记的全部属性

??

(四)、特殊字符:

? ? ?有部分元字符在正則表達式中代表特定的含义。假设要匹配这些字符本身。须要使用反斜杠"\"进行转义。这些特殊字符有:

  1. ^ $
  2. * + ?

  3. { } ( ) [ ]
  4. ?\ / ? ? . ? ?|?

【备注:】以上特殊符号在实际定义regexp字符串的时候,实际上使用两个反斜杠"\\"。

(五)、元字符优先级顺序(从高到低,从左到右)

  1. \ ???转义字符
  2. ()?? 圆括号,?[]??方括号
  3. * ?+ ? ? ?{n} ?{n,} ?{n,m}??限定符
  4. ^ ?$??開始和结束标识
  5. |?? "或"操作

(六)、正則表達式的用途:

????1、数据有效性验证:用户注冊模块是应用正則表達式最集中的地方。主要是用于验证用户帐号、password、EMAIL、电话号码、QQ号码、身份证号码、家庭地址等信息。假设填写的内容与正則表達式不匹配。能够断定填写的内容是不合乎要求或虚假的信息;

????2、模糊查询。批量替换。

能够在文档中使用一个正則表達式来查找匹配的特定文字,然后能够全部将其删除,或者替换为别的文字。

(七)、经常使用的正則表達式的写法:

????1、中文字符:^[\u4E00-\u9FA5]+$

????2、手机号码:^(86)?0?

1\d{10}$

????? ? ?电话号码:^((d{3,4})|d{3,4}-)?

d{7,8}$

? ? 3、Email地址:^[\w-]+[\w-.][email protected][\w-]+(\.[A-Za-z]{2,5})+$

????? ? ?Email地址:^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$

????? ? ?Email地址:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

? ??4、URL网址:^http://([w-]+.)+[w-]+(/[w-./?

%&=]*)?$

????? ? ??URL网址:http://([w-]+.)+[w-]+(/[w- ./?

%&=]*)?

????5、password(安全级别中):^(\d+[A-Za-z]\w*|[A-Za-z]+\d\w*)$

????6、password(安全级别高):^(\d+[[email protected]#$%^&(){}][\[email protected]#$%^&(){}]*|[[email protected]#$%^&(){}]+\d[\[email protected]#$%^&(){}]*)$

【备注:】对于同一个需求的正則表達式。因理解不同和验证的严格程度不同而差异非常大,没有固定的统一写法。仅仅要尽量与需求进行匹配就能够。

(八)、正則表達式的备注说明:【了解】

? ? 1、大写英文字母的正則表達式。除了能够写成[A-Z],还能够写成[\x41-\x5A]。

由于在ASCII码字典中A-Z被排在了65-90号(也就是ASCII码的第66到第91位),换算成16进制就是0x41-0x5A;

????2、[0-9]。能够写成[\x30-\x39];

????3、[a-z],能够写成[\x61-\x7A]。

? ? 4、中文的正則表達式为:[\u4E00-\u9FA5]

? ? ? ? 由于中文在unicode编码字典中排在4E00到9FA5之间。换成10进制。也就是第19968号到40869号是中文字,一共20902个中文字被搜录到unicode编码集中。(常识了解:第19968号是“一”,而第40869号是“龥”——发音为yu)。

二、Android中正則表達式的使用方法:

(一)、核心类:

????1、public final class java.util.regex.Pattern

????????Pattern是正則表達式的编译后的对象形式,即正则模式。

? ? ? ? Pattern类是final类。并且它的构造器是private。因此Pattern类不能被继承,不能通过new创建Pattern对象。因此在Pattern类中,提供了2个重载的静态方法,其返回值是Pattern对象。

????? ??Pattern?pattern = Pattern.compile(String regexp);

? ? ? ? 将一个字符串转成正则匹配模式对象。

相似于在ContentProvider中将一个字符串先转成Uri对象一样。

? ? 2、Matcher?match = pattern.matcher(须要匹配的字符串)

????????Matcher是正则模式匹配给定字符串的匹配器.

? ? ? ? Pattern对象调用匹配器matcher()方法。查找符合匹配要求的匹配项。

Matcher匹配器对象是由匹配模式对象Pattern创建的。

????????Matcher match = pattern.matcher("要匹配的字符串");

? ? 3、Boolean flag = match.matches();

????????推断须要匹配的字符串是否与正则regex匹配.

? ? 4、Boolean flag = match.find();

? ? ? ? Attempts to find the next subsequence of the input sequence that matches?the pattern.

? ? ? ? 尝试查找下一个匹配模式的字符串序列。

【备注:】

? ? 1、与Cursor中的next()方法相似。Cursor中每next一次。数据就指向下一条。同理。Matcher对象每find一次。匹配项就指向下一个。

? ? 2、match.matches()和match.find()这两个方法都能够推断"要匹配的字符串"是否与正则regex匹配,它们有什么差别呢? ?——匹配方式不一样

  • matches() 是拿整个输入的字符串和定义的正则模式匹配; ? ?刚好匹配到整串
  • find() 是包括匹配, 整个输入的字符串包括定义的正则模式。匹配到子串

????match对象在调用matches()后改动了这个对象的某个全局变量。在matches()方法中有this.oldLast = this.last;等代码, 而find()中则没有。

(二)、演示样例代码:【用户注冊时,验证username和password是否符合输入格式】


protected void onCreate(Bundle savedInstanceState) {

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_main);

// 定义username和password的文本编辑框

editText_main_username = (EditText) findViewById(R.id.editText_main_username);

editText_main_password = (EditText) findViewById(R.id.editText_main_password);

// 定义用户登录的提交按钮

button_main_submit = (Button) findViewById(R.id.button_main_submit);

// 给提交按钮添加单击监听器

button_main_submit.setOnClickListener(new View.OnClickListener() {

@Override

public void onClick(View v) {

// 获取表单控件的数据

String username = editText_main_username.getText().toString();

String password = editText_main_password.getText().toString();

// 先推断username和password是否为空,假设为空,则给予提示。不再继续运行

if (username.equals("") || password.equals("")) {

Toast.makeText(MainActivity.this, "username或password不得为空!", 5000).show();

} else {

// 假设username和password都不为空。再推断username和password是否匹配指定的格式。

假设不符合则给予提示,并不再继续运行。

if (!checkUsername(username) && !checkPassword(password)) {

Toast.makeText(MainActivity.this, "username不符合要求!", 5000).show();

} else {

try {

// 为了避免出现乱码,对username等含有中文的字符串进行编码处理。

postString = "username="

+ URLEncoder.encode(username, "utf-8")

+ "&password=" + password;

// 调用异步任务。訪问网络

new MyTask(MainActivity.this).execute(urlString);

} catch (Exception e) {

e.printStackTrace();

}

}

}

}

});

}

// 验证username是否匹配指定格式的方法

public boolean checkUsername(String str) {

String regexp = "^[a-zA-Z]{6,20}$";

Pattern pattern = Pattern.compile(regexp);

Matcher matcher = pattern.matcher(str);

return matcher.matches();

}

// 验证password是否匹配指定格式的方法

public boolean checkPassword(String str) {

String regexp = "^[0-9a-zA-Z]{6}$";

Pattern pattern = Pattern.compile(regexp);

Matcher matcher = pattern.matcher(str);

return matcher.matches();

}

//获取全部匹配项

private?List<String> getPatternList(String str, String regexp) {

List<String> list =?new?ArrayList<String>();

Pattern pattern = Pattern.compile(regexp);

Matcher matcher = pattern.matcher(str);

while?(matcher.find()) {

if?(!list.contains(matcher.group()))

list.add(matcher.group());

}

return?list;

}

?public static String convertAngleTag(String str) {

? str = str.replaceAll("<", "&lt;");

? str = str.replaceAll(">", "&gt;");

? return str;

?}

三、工具类:UbbToHtml.java:【后期项目中会用到】

????? ??AndroidManual项目中,从数据库中取出的数据中含有自己定义的UBB标签。

为了能在WebView中有格式地显示。须要将UBB标签转成html标记语言。假设不懂得正则,非常难能做到。下面演示样例代码就以AndroidManual项目中的标签替换为例。

也希望同学们能将下面代码用于自己的AndroidManual项目中。体会正則表達式的使用方法。

【备注:】

????????下面代码中使用了StringBuffer类,请思考能否够用StringBuilder?

工具类:UbbToHtml.java

package com.steven.helper;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class UbbToHtml {
        // 将ubb标签语言转成html
        public static String convertUbbToHtml(String str) {
                str = convertAngleTag(str);
                str = convertCommentTag(str);
                str = convertColorTag(str);
                str = convertImgTag(str);
                str = convertFieldsTag(str);
                str = convertKeywordsTag(str);
                str = convertJavaTag(str);
                str = convertOtherTag(str);
                return str;
        }

        // 将[code=img]和[/code]标签转成html
        public static String convertImgTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(\\[code=img\\])([^\\[]+)(\\[/code\\])";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb, "<img src=\"file:///android_asset/" + match.group(2) + "\" width=‘230dp‘>");
                        result = match.find();
                }
                //match.appendTail(sb);
                return sb.toString();
        }

        // 将[code=java]和[/code]标签转成html
        public static String convertJavaTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(\\[code=java\\])\n?([\\s\\S]+?)(\\[/code\\])";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb, "<div style=‘border:solid 1px #bbb;background:#eee;padding:8; margin:10 0 10 0;‘>" + match.group(2) + "</div>");
                        result = match.find();
                }
                match.appendTail(sb);
                return sb.toString();
        }

        // 将[color=blue]标签转成html
        public static String convertColorTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(\\[color=blue\\])([^\\s]+)([\\s]+?

)";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb,"<div style=‘color:blue;margin:10 0 10 0;font-weight:bolder;‘>" + match.group(2) + "</div>");
                        result = match.find();
                }
                match.appendTail(sb);
                return sb.toString();
        }

        // 将#[Fields]标签转成html
        public static String convertFieldsTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(#\\[Fields\\])([^#]+?

)#";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb,"<span style=‘color:red;‘>" + match.group(2) + "</span>");
                        result = match.find();
                }
                match.appendTail(sb);
                return sb.toString();
        }

        // 将#[Keywords]标签转成html
        public static String convertKeywordsTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(#\\[Keywords\\])(\\w+[\\s]?)";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb,"<span style=‘color:#900;‘>" + match.group(2) + "</span>");
                        result = match.find();
                }
                match.appendTail(sb);
                return sb.toString();
        }

        // 将#[Comments]标签转成html
        public static String convertCommentTag(String str) {
                if (str == null || str.length() == 0) {
                        return str;
                }
                String regexp = "(#\\[Comments\\]//)([^#]+)";
                Pattern pattern = Pattern.compile(regexp);
                Matcher match = pattern.matcher(str);
                StringBuffer sb = new StringBuffer();
                boolean result = match.find();
                while (result) {
                        match.appendReplacement(sb, "<div>//" + match.group(2) + "</div>");
                        result = match.find();
                }
                match.appendTail(sb);
                return sb.toString();
        }

        // 将\n换行标签及其它标签转成html
        public static String convertOtherTag(String str) {
                str = str.replaceAll("#\\}", "<br/>}");
                str = str.replaceAll("#", "");
                str = str.replaceAll("\n", "<br/>");
                return str;
        }

        // 将左尖括号和右尖括号转成实体符号&lt;和&gt;。在html标签语言中,“<”和“>”会被觉得是html标记。

因此要先将其替换。
        public static String convertAngleTag(String str) {
                str = str.replaceAll("<", "&lt;");
                str = str.replaceAll(">", "&gt;");
                return str;
        }
}
//调用页面仅仅须要调用:String newStr = UbbToHtml.convertUbbToHtml(须要替换的字符串); 就可以。

四、经常使用正則表達式的写法:

(一)、【附录1:】经常使用的正則表達式写法一:

匹配特定数字:
^[1-9]d*$    //匹配正整数
^-[1-9]d*$   //匹配负整数
^-?

[1-9]d*$   //匹配整数
^[1-9]d*|0$  //匹配非负整数(正整数 + 0)
^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)
^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数
^-?

([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)

匹配特定字符串:
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串

仅仅能输入数字:“^[0-9]*$”
仅仅能输入n位的数字:“^d{n}$”
仅仅能输入至少n位数字:“^d{n,}$”
仅仅能输入m-n位的数字:“^d{m,n}$”
仅仅能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”
仅仅能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?

$”
仅仅能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”
仅仅能输入非零的正整数:“^+?[1-9][0-9]*$”
仅仅能输入非零的负整数:“^-[1-9][0-9]*$”
仅仅能输入长度为3的字符:“^.{3}$”
仅仅能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”
仅仅能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”
仅仅能输入由26个小写英文字母组成的字符串:“^[a-z]+$”
仅仅能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”
仅仅能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$”
验证用户password:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头。长度在6-18之间,

仅仅能包括字符、数字和下划线。

验证是否含有^%&’,;=?$”等字符:“[^%&’,;=?

$x22]+”
仅仅能输入汉字:“^[u4e00-u9fa5]{0,}$”
验证身份证号(15位或18位数字):“^d{15}|d{}18$”
验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”

匹配中文字符的正則表達式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
匹配空行的正則表達式:n[s| ]*r
匹配HTML标记的正則表達式:/< (.*)>.*|< (.*) />/
匹配首尾空格的正則表達式:(^s*)|(s*$)

(二)、【附录2:】经常使用的正則表達式写法二:


  1. 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$
  2. 仅仅能输入数字:"^[0-9]*$"。
  3. 仅仅能输入n位的数字:"^\d{n}$"。
  4. 仅仅能输入至少n位的数字:"^\d{n,}$"。
  5. 仅仅能输入m~n位的数字:。"^\d{m,n}$"
  6. 仅仅能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
  7. 仅仅能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
  8. 仅仅能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?

    $"。

  9. 仅仅能输入非零的正整数:"^\+?

    [1-9][0-9]*$"。

  10. 仅仅能输入非零的负整数:"^\-[1-9][]0-9"*$。
  11. 仅仅能输入长度为3的字符:"^.{3}$"。
  12. 仅仅能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
  13. 仅仅能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
  14. 仅仅能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
  15. 仅仅能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。
  16. 仅仅能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。
  17. 验证用户password:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间。仅仅能包括字符、数字和下划线。

  18. 验证是否含有^%&‘,;=?$\"等字符:"[^%&‘,;=?$\x22]+"。
  19. 仅仅能输入汉字:"^[\u4e00-\u9fa5]{0,}$"
  20. 验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"。

  21. 验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?

    $"。

  22. 验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。
  23. 验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。
  24. 验证一年的12个月:"^(0?

    [1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。

  25. 验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。
  26. 匹配中文字符的正則表達式: [\u4e00-\u9fa5]
  27. 匹配双字节字符(包括汉字在内):[^\x00-\xff]
  28. 匹配空行的正則表達式:\n[\s| ]*\r
  29. 匹配html标签的正則表達式:<(.*)>(.*)<\/(.*)>|<(.*)\/>
  30. 匹配首尾空格的正則表達式:(^\s*)|(\s*$)

原文地址:https://www.cnblogs.com/llguanli/p/8452831.html

时间: 2024-07-30 10:32:33

正則表達式及应用的相关文章

javascript中的正則表達式

对文本数据进行操作是JavaScript中常见的任务.正則表達式通过同意程序猿指定字符串匹配的模式来简化诸如验证表单中输入是否具有正确格式之类的任务. 1.正則表達式标记: 字符 含义 举例 i 大写和小写不敏感 对于模式/http/i  "http" 和"HttP" 一样能够匹配 g 全局匹配.找出所有匹配字符串,而不不过找到第一个就返回. 经常使用于替换 m 多行匹配 2.正則表達式位置指示符:规定模式在它所匹配的字符串里的位置. 字符 含义 举例 ^ 开头 对

经验之谈—正則表達式实现图文混排

在项目中,我们常常须要发表情,以及常常须要将表情字符转换成表情.由于表情是一个图片.所以我们发给server的时候,实际上是发一段特殊的文字给server,然后转换成表情.以免浪费用户过多的流量. 那接下来.我们就来介绍一下,怎样使用正則表達式实现图文混排呢? 为了以后的代码的管理方便,我们抽取出两个类: NSString+Regular.h中.我们暴露两个方法出来: /** * 返回正則表達式匹配的第一个结果 * * @param pattern 正則表達式 * * @return 匹配的第一

JAVA学习第六十五课 — 正則表達式

正則表達式:主要应用于操作字符串.通过一些特定的符号来体现 举例: QQ号的校验 6~9位.0不得开头.必须是数字 String类中有matches方法 matches(String regex) 告知此字符串是否匹配给定的正則表達式. regex,就是给定的正則表達式 public static void checkQQ() { //第一位是数字1-9,第二位以后是0-9,除去第一位数剩下数字位数范围是5到8位 String regex = "[1-9][0-9]{5,8}";//正

HDU-1039-Easier Done Than Said?(Java &amp;amp;&amp;amp; 没用正則表達式是我的遗憾.....)

Easier Done Than Said? Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 9845    Accepted Submission(s): 4784 Problem Description Password security is a tricky thing. Users prefer simple password

正則表達式

一.概述 正則表達式是一种能够用于模式匹配和替换的强有力的工具.其作用例如以下: (1)測试字符串的某个模式.比如,能够对一个输入字符串进行測试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式.这称为数据有效性验证. (2)替换文本.能够在文档中使用一个正則表達式来标识特定文字,然后能够所有将其删除,或者替换为别的文字: (3)依据模式匹配从字符串中提取一个子字符串. 能够用来在文本或输入字段中查找特定文字. 二.匹配字符 字符 解释说明 \ 将下一字符标记为特殊字符.文本.反向引用或

js正則表達式语法

1. 正則表達式规则 1.1 普通字符 字母.数字.汉字.下划线.以及后边章节中没有特殊定义的标点符号,都是"普通字符".表达式中的普通字符,在匹配一个字符串的时候,匹配与之同样的一个字符. 举例1:表达式 "c",在匹配字符串 "abcde" 时,匹配结果是:成功:匹配到的内容是:"c":匹配到的位置是:開始于2,结束于3.(注:下标从0開始还是从1開始,因当前编程语言的不同而可能不同) 举例2:表达式 "bcd&

Java正則表達式入门

众所周知,在程序开发中,难免会遇到须要匹配.查找.替换.推断字符串的情况发生,而这些情况有时又比較复杂,假设用纯编码方式解决,往往会浪费程序猿的时间及精力.因此,学习及使用正則表達式,便成了解决这一矛盾的主要手段. 大 家都知道,正則表達式是一种能够用于模式匹配和替换的规范,一个正則表達式就是由普通的字符(比如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描写叙述在查找文字主体时待匹配的一个或多个字符串.正則表達式作为一个模板,将某个字符模式与所搜索的字符串进行匹配.  自从jdk1

DOM笔记(十):JavaScript正則表達式

一.RegExp ECMAScript通过RegExp类型类支持正則表達式,语法和Perl类似: var exp = /pattern/flags; patternb部分是不论什么简单的或复杂的正則表達式:flags是每一个正則表達式所带的一个或者多个标志. 正則表達式的模式匹配支持三个标志: g:全局模式,即模式应用于整个字符串.而非在发现第一个匹配项时马上停止 i:不区分大写和小写模式 m:多行模式,即到达一行文本末尾是还会继续茶查找下一行中是否存在与模式匹配的项. 1.创建正則表達式 Ja

正則表達式常见例题

常见例题 例1:北美地区的电话号 编码方案:电话号码有一个3位数的区号和一位7位数的号码组成(这个7位数有分成  一个3位的局号和一个4位的路号.局号和路号之间使用连字符分隔) 每位电话号码能够是随意数字,可是区号和局号的第一位数字不能是0或1.实际书写号码是往往会把区号写在括号中面,或者将区号使用连字符和后面的局号连接起来.比如:(555)123-1234或555-123-1234,有时候在括号你里面会包括空格.比如:(555 )123-1234 文本: J.Doe:248-555-1234

shell脚本学习笔记 (正則表達式)

正則表達式一般有三个部分组成,他们各自是:字符类,数量限定符,位置限定符. 规定一些特殊语法表示字符类.数 量限定符和位置关系,然后用这些特殊语法和普通字符一起表示一个模式,这就是正則表達式(Regular Expression). 我们以一 个样例開始吧.假如给你一个文件,里面存放的是IP地址,可是有一些不是合格的.请你找出合格的IP地址.我想不知道正 则表达式的人一定会认为好陌生,我拿一个循环去实现,我之前也被问到过这个问题,也是想着拿循环来完毕.写出一个函 数来实现这个查找功能实在是不简单