正则表达式的基本使用

基础

正则表达式可以用来对符合某些特征的字符串进行检索、选择、编辑、验证。它的适用性非常广泛,许多编程语言都在语言级别或者类库中提供对正则表达式的支持,除此之外许多文本检索工具都支持使用正则表达式,我们在使用git进行过滤文件时也能看到它的身影.....

一个简单例子,试编程判断一个字符串是否全部由数字组成。

传统判断方式:

public class RegexDemo01{
     public static void main(String args[]){
          String str = "1234567890" ; // 此字符串由数字组成
          boolean flag = true ; // 定义一个标记变量
          // 要先将字符串拆分成字符数组,之后依次判断
          char c[] = str.toCharArray() ; // 将字符串变为字符数组
          for(int i=0;i<c.length;i++){ // 循环依次判断
               if(c[i]<'0'||c[i]>'9'){ // 如果满足条件,则表示不是数字
                    flag = false ; // 做个标记
                    break ; // 程序不再向下继续执行
               }
          }
          if(flag){
               System.out.println("是由数字组成!") ;
          }else{
               System.out.println("不是由数字组成!") ;
          }
     }
};

采用正则表达式:

import java.util.regex.Pattern ;
public class RegexDemo02{
     public static void main(String args[]){
          String str = "1234567890" ; // 此字符串由数字组成
          if(Pattern.compile("[0-9]+").matcher(str).matches()){ // 使用正则
               System.out.println("是由数字组成!") ;
          }else{
               System.out.println("不是由数字组成!") ;
          }
     }
};

正则表达式的基本语法

表格
B 指定字符B
\xhh 十六进制值为oxhh的字符
\uhhh 十六进制表示为oxhhh的unicode字符
\t 制表符Tab
\n 换行符
\r 回车
\f 换页
\e 转义(Escape)
字符类
[abc] 包含a、b和c的任何字符(和a|b|c作用相同)
[^abc] 除了a、b和c之外的任何字符(否定)
[a-zA-Z] 从a到z或从A到Z的任何字符(范围)
[abc[hij]] 任意a、b、c、h、i、j字符
\s 空白符(空格、tab、换行、换页和回车)
\S 非空白符( [^\s] )
\d 数字[0-9]
\D 非数字[^0-9]
\w 词字符[a-zA-Z0-9]
\W 非词字符[^\w]
匹配除换行以外的任意字符

提醒: 在java的正则表达式中,除了换行和制表符之类的东西只需要直接使用单反斜线 :\n\t 之外,其他在遇到 \ 的时候,需要对其进行转义,比如在使用\d 时就必须要使用\\d,在遇到其他一些歧义的时候,也需要进行转义,例如插入一个普通的反斜线,应该使用\\\\ ,插入一个 | ,则需要使用 \\| 。

怎么表示任意字符呢 ?

既然\s表示空白字符,\S表示非空白符,那么[\s\S] 便能表示一个任意字符,[\s\S]* 便能表示任意一个字符串。

类似的,[\d\D]、[\w\W]、[.\n]都可以起到同样的作用。

逻辑操作符
XY Y跟在X后面
X|Y X或Y
(X) 捕获组
匹配边界符
^ 一行的起始
$ 一行的结束
\b 词的边界
\B 非词的边界
\G 前一个匹配的结束
量词
X? 一个或零个X
X* 零个或一个或多个X
X+ 一个或者多个X
X{n} 恰好n次X
X{n,} 至少n次X
X{n,m} X至少n次,且不超过m次

Pattern、Matcher类

这两个类是正则操作的核心类,都定义在java.util.regex包中。Pattern主要进行正则规范的编写,Matcher类主要用来执行规范,验证一个字符串是否符合其规范。

Pattern的常用方法:

方法 描述
public static Pattern complie(String regex) 返回正则表达式规则
public Matcher matcher(CharSequence input) 取得Matcher实例
public String[] split(CharSequence input) 字符串拆分

Matcher类的常用方法:

方法 描述
public boolean matches() 执行验证
public String replaceAll(String replacement) 字符串替换

使用例:

public class RegexDemo03{
     public static void main(String args[]){
          String str = "1983-07-27" ; // 指定好一个日期格式的字符串
          String pat = "\\d{4}-\\d{2}-\\d{2}" ; // 指定好正则表达式
          Pattern p = Pattern.compile(pat) ; // 实例化Pattern类
          Matcher m = p.matcher(str) ; // 实例化Matcher类
          if(m.matches()){ // 进行验证的匹配,使用正则
               System.out.println("日期格式合法!") ;
          }else{
               System.out.println("日期格式不合法!") ;
          }
     }
};

String类对正则的支持

日常中,一般使用String中提供的正则支持,而很少使用Pattern和Matcher类。

String中常用的支持正则的方法:

方法 描述
public boolean matches(String regex) 字符串匹配
public String replaceAll(String regex,String replacement) 字符串替换
public String[] split(String regex) 字符串拆分

例:

public class RegexDemo06{
     public static void main(String args[]){
          String str1 = "A1B22C333D4444E55555F".replaceAll("\\d+","_") ;
          boolean temp = "1983-07-27".matches("\\d{4}-\\d{2}-\\d{2}") ;
          String s[] = "A1B22C333D4444E55555F".split("\\d+") ;
          System.out.println("字符串替换操作:" + str1) ;
          System.out.println("字符串验证:" + temp) ;
          System.out.print("字符串的拆分:") ;
          for(int x=0;x<s.length;x++){
               System.out.print(s[x] + "\t") ;
          }
     }
};

时间: 2024-08-14 10:39:33

正则表达式的基本使用的相关文章

【Linux系列】【基础版】第四章 Shell基础之正则表达式

4. Shell基础之正则表达式     4.1 正则就是一串有规律的字符串         4.1 grep              4.1.1 格式: grep [-cinrvABC] 'word' filename             4.1.2 -c //count,表示行数             4.1.3 -i //不区分大小写             4.1.4 -n  //显示行号             4.1.5 -r  //遍历所有子目录             4

正则表达式中的逆向思维

人们的正常思维都是顺向的,那么逆向思维呢,特别是初学正则表达式的同学们,好不容易掌握了正则表达式的用法,再突然要你用逆向思维做题,会有很多不适应: 这里拿三道题,来做简单介绍: 1.经典例题取IP: [[email protected] ~]# ifconfig eth0|sed -nr '2s#^[^0-9]+(.*)[a-Z]{5,}.*#\1#gp' 10.0.0.200 2.调换/etc/passwd中最后一列和第一列的位置: [[email protected] ~]# head /p

JAVA正则表达式:Pattern类与Matcher类详解(转)

java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式. Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行字符串的匹配工作

前端学PHP之正则表达式函数

前面的话 正则表达式不能独立使用,它只是一种用来定义字符串的规则模式,必须在相应的正则表达式函数中应用,才能实现对字符串的匹配.查找.替换及分割等操作.前面介绍了正则表达式的基础语法,本文将详细介绍正则表达式函数 匹配与查找 [preg_match()] preg_match()函数用来执行一个正则表达式匹配,搜索subject与pattern给定的正则表达式的一个匹配.返回pattern的匹配次数.它的值将是0次(不匹配)或1次,因为preg_match()在第一次匹配后将会停止搜索.preg

正则表达式

grep命令和正则表达式 一. 正则 : 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑.给定一个正则表达式和另一个字符串,我们可以达到如下的目的:1. 给定的字符串是否符合正则表达式的过滤逻辑(称作"匹配"):2. 可以通过正则表达式,从字符串中获取我们想要的特定部分. 正则表达式和通配符一样,也是一组特殊符号,通配符是由sh

java中的正则表达式

正则表达式 : 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串.将匹配的子串替换或者从某个串中取出符合某个条件的子串等. 一些字符所代表的意思: \        将下一字符标记为特殊字符.文本.反向引用或八进制转义符^       匹配输入字符串开始的位置$       匹配输入字符串结尾的位置.        匹配任何单个字符\s      空白(空格符.换行符.回车符.制表符)\S     非空白[]  

Python 正则表达式相关问题

这几天学习python,写正则表达式相关代码如下: import re print(re.search(r'(?<=<(\w+)>).*(?=<\/\1>)',"<b>ewuiiriur</b>sdksfkj").span()) 报错如下: raise error("look-behind requires fixed-width pattern")sre_constants.error: look-behind

7.python之正则表达式re模块

一.re模块的常用方法: re.findall() 用于返回一个字符串中,所有能被正则表达式所匹配到的字符串,以列表的方式返回. 用法re.findall(正则表达式,字符串). s1 = "sadjhjafdsajkhjsdaysadsadduayu" 比如说,想要从上面这一长串字符串中,匹配出a后面有一个任一字符在紧接着一个字母u的字符串. print re.findall('a.u',s1) >>>['ayu'] re.finditer()作用和findall一

JS中有关正则表达式的一些常见应用

总所周知,正则表达式主要用于字符串处理.表单验证等,简单的代码量实现复杂的功能 1.身份证号码的一个校验 先做一个简单的位数校验来判断身份证的合法性:(15位数字或18位数字或17位数字加X|x) var reg=/(^\d{15}$)|(^\d{18}$)|(^\d{17}(^\d|X|x)$)/ if(reg.test(num) === false){ alert("你输入的身份证不合法"); return false; } 18位=前六位地区+中八位出生日期+后4位顺序号(最后一

4-4 grep及正则表达式

1. grep:Globally search a Regular Expression and Print:根据模式搜索文本,并将符合模式的文本行显示出来 pattern:文本字符和正则表达式的元字符 一般查询 其中 -i:忽略大小写 --color: 另外,删掉alias,是以如下格式 -v:显示没有被模式匹配的行 -o:只显示被模式匹配到的字符串 2. 正则表达式:regular expression,简称REGXP 3. 位置锚空 ^: 锚空行道,此字符后的任意内容必须出现在行首 $: