正则表达式(轻松入门级)

前言:正则表达式又称为火星文,因为视觉上让人感觉很复杂。本文将会详细介绍正则表达式,初学者只要认真阅读过,定会有收获。

1、正则的概念

  正则表达式(regular expression)是一个描述字符规则的对象。可以用来检查一个字符串是否含有某个子字符串,将匹配的子字符串替换或者从某个字符串中取出符合某个条件的子串等。

  为什么要用正则:前端往往有大量的表达数据校验工作,采用正则表达式会使得数据校验的工作量大大减轻。常用效果(邮箱、手机号、身份证号等等)。

2、创建方式

  第一种方式:

// 通过构造函数的方式
  var oReg = new RegExp(‘study‘, ‘i‘);

  第二种方式:

// 通过语法糖(简写)的形式
  var oReg = /study/i;

  修饰符:

  i :表示忽略大小写。

  g:表示全局匹配,查找所有匹配而非在找到第一个匹配后停止。

  m:多行匹配。

3、正则对象方法

  test:检索字符串中指定的值。返回true或false。

  exec:用于检索字符串中的正则表达式的匹配。返回一个数组,其中存放匹配的结果,如果未找到匹配,则返回值为null。

  下面我们来个举个列子:

  // 首先我来看test
  //我们要在字符串str中找出符合Reg的规则的子字符串,符合则返回true,不符合则返回false
    var str = ‘Good good study, Day day up! Good good study‘;
    var Reg1= /good/ig;
    var Reg2= /goood/ig;
    console.log(Reg1.test(str));//true
    console.log(Reg2.test(str));//false

  

    // 接下来我们再来看 exec
    //用于检索字符串中的正则表达式的匹配。返回一个数组,其中存放匹配的结果,如果未找到匹配,则返回值为null
    var str = ‘Good good study, Day day up! Good good study‘;
    var Reg= /good/ig;
    console.log(Reg.exec(str));//["Good", index: 0, input: "Good good study, Day day up! Good good study"]
    console.log(Reg.exec(str));//["good", index: 5, input: "Good good study, Day day up! Good good study"]
    console.log(Reg.exec(str));//["Good", index: 29, input: "Good good study, Day day up! Good good study"]
    console.log(Reg.exec(str));//["good", index: 34, input: "Good good study, Day day up! Good good study"]
    console.log(Reg.exec(str));//null
    //注:如果没有指定g修饰符,那么每次匹配都是从头开始匹配,如果指定g修饰符以后,下次匹配则从上次匹配的结束位置开始匹配。

4、字符串函数

  search:检索与正则表达式相匹配的值,返回字符串中第一个与正则表达式相匹配的子串的起始位置,如果没有找到则返回-1。

  match :找到一个或多个正则表达式的匹配。

  replace:替换与正则表达式匹配的子串。

  split      :把字符串分割为字符串数组。

  单看概念不容易理解,看看下面的小实列就一目了然

    var str = ‘Good good study, Day day up! Good good study‘;
     var Reg= /study/ig;
     console.log(str.search(Reg));//10
     console.log(str.match(Reg));// ["study", "study"]
     console.log(str.replace(Reg,‘aaaa‘));//Good good aaaa, Day day up! Good good aaaa
     console.log(str.split(Reg));//["Good good ", ", Day day up! Good good ", ""]

5、正则表达式构成

  正则表达式是由普通字符(列如字符a到z)以及特殊字符(称为元字符)组成的文字模式。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

  ①元字符---限定符:

  *:匹配前面的子表达式零次或多次。

  +:匹配前面的子表达式一次或多次。

  ?:匹配前面的子表达式零次或一次。

  {n}:匹配确定n次。

  {n,}:至少匹配n次。

  {n,m}:最少匹配n次且最多匹配m次。

  实列如下:

var str =‘gd god good goood gooood‘;

     var Reg1 =/go*d/ig; //*:匹配前面的子表达式零次或多次
     console.log(str.match(Reg1));//["gd", "god", "good", "goood", "gooood"]

     var Reg2 =/go+d/ig; //+:匹配前面的子表达式一次或多次
     console.log(str.match(Reg2));//["god", "good", "goood", "gooood"]

     var Reg3 =/go?d/ig; //?:匹配前面的子表达式零次或一次
     console.log(str.match(Reg3));//["gd", "god"]

     var Reg4 =/go{2}d/ig; //{n}:匹配确定n次
     console.log(str.match(Reg4));//["good"]

     var Reg5 =/go{2,}d/ig; //{n,}:至少匹配n次
     console.log(str.match(Reg5));//["good", "goood", "gooood"]

     var Reg6 =/go{1,3}d/ig; //{n, m}:最少匹配n次且最多匹配m次
     console.log(str.match(Reg6));//["god", "good", "goood"]

 

  ②元字符---字符匹配符:

  字符匹配符用于匹配某个或某些字符。

  [xyz]:字符集合。匹配所包含的任意一个字符。

  [^xyz]:负值字符集合。匹配未包含的任意字符。

  [a-z]:字符范围。匹配指定范围内的任意字符。

  [^a-z]:负值字符范围。匹配任何不在指定范围内的任意字符。

  \d:匹配一个数字字符。

  \D:匹配一个非数字字符。

  \w:匹配包含下划线的任何单词字符。等价于[a-z0-9A-Z_]

  \W:匹配任何非单词字符。等价于[^a-z0-9A-Z_]

  \s:匹配任何空白字符。

  \S:匹配任何非空白字符。

  ·:匹配除”\n”之外的任何单个字符。

  实列如下:

     var str = ‘aiod acd abd add aed afd ahd $%#@ 12345678 asdfghh‘;

     var Reg1 = /a[abc]d/ig;        //[xyz]:字符集合。匹配所包含的任意一个字符
     console.log(str.match(Reg1)); //["acd", "abd"]

     var Reg2 = /a[^abc]d/ig;       //[^xyz]:负值字符集合。匹配未包含的任意字符
     console.log(str.match(Reg2)); // ["add", "aed", "afd", "ahd", "asd"]

     var Reg3 = /a[a-z]d/ig;        //[a-z]:字符范围。匹配指定范围内的任意字符
     console.log(str.match(Reg3)); //["acd", "abd", "add", "aed", "afd", "ahd", "asd"]

     var Reg4 = /a[^a-e]d/ig;      //[^a-z]:负值字符范围。匹配任何不在指定范围内的任意字符
     console.log(str.match(Reg4)); //["afd", "ahd", "asd"]

     var Reg5 = /\d+/ig;             //  \d:匹配一个数字字符。
     console.log(str.match(Reg5));  //["12345678"]

     var Reg6 = /\D+/ig;            //    \D:匹配一个非数字字符
     console.log(str.match(Reg6));  //["aiod acd abd add aed afd ahd $%#@ ", " asdfghh"]

     var Reg7 = /\w+/ig;            //   \w:匹配包含数字,字母,下划线的任何单词字符,等价于[a-z0-9A-Z_]
     console.log(str.match(Reg7));  //["aiod", "acd", "abd", "add", "aed", "afd", "ahd", "12345678", "asdfghh"]

     var Reg8 = /\W+/ig;            //    \W:匹配任何非单词字符。等价于[^a-z0-9A-Z_]
     console.log(str.match(Reg8));  // [" ", " ", " ", " ", " ", " ", " $%#@ ", " "]

     var Reg9 = /\s+/ig;            //    \s:匹配任何空白字符
     console.log(str.match(Reg9));  //[" ", " ", " ", " ", " ", " ", " ", " ", " "]

     var Reg10 = /\S+/ig;            //    \S:匹配任何非空白字符
     console.log(str.match(Reg10)); //["aiod", "acd", "abd", "add", "aed", "afd", "ahd", "$%#@", "12345678", "asdfghh"]

  

  ③元字符---定位符:

  定位符可以将一个正则表达式固定在一行的开始或结束,也可以创建只在单词内或只在单词的开始或结尾处出现的正则表达式。  

  ^:匹配输入字符串的开始位置。

  $:匹配输入字符串的结束位置。

  \b:匹配一个单词边界,也就是单词和空格间的位置。

  \B:匹配非单词边界。

// ^:匹配输入字符串的开始位置。
    var str  =‘123456‘;
    var Reg1  =/^\d+/ig;
    var Reg2  =/\d/ig;
    console.log(Reg1.test(str));//true
//$:匹配输入字符串的结束位置。
    var str =‘abcd789‘;
    var Reg =/.+\d{3}$/ig;
    console.log(Reg.test(str));//true
// \b:限定单词以什么开头和结尾,\B:限定单位不以什么开头和结尾
var str = ‘good ogoodm goods sgoods‘;

var reg1 = /\bg\w+/g;
var reg2 = /\w+d\b/g;
console.log(str.match(reg1));//["good", "goods"]
console.log(str.match(reg2));//["good"]
var reg3 = /\Bg\w+/g;
var reg4 = /\w+d\B/g;
console.log(str.match(reg3));//["goodm", "goods"]
console.log(str.match(reg4));//["ogood", "good", "sgood"]

  ④元字符---转义符

  \:用于匹配某些特殊字符(遇到特殊字符需要用反斜杠转义)

 // 特殊字符:. + * ? {} [] ^ $ \

    var str = ‘++++++-*/%‘;
    var oReg = /\++/g;
    console.log(str.match(oReg));//["++++++"]

  

  ⑤元字符---选择匹配符

  |:可以匹配多个规则

// 选择匹配符
var str = ‘gooqd gaawd gwwsd‘;
var oReg = /g(ooq|aaw)d/g;
console.log(str.match(oReg));// ["gooqd", "gaawd"]

  接下来是常用简单型检测案例

  1、手机号检测

// 下面是国内 13、15、18开头的手机号正则表达式。(可根据目前国内收集号扩展前两位开头号码)
var reg = /^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$/

  2、检测中文

//字符串只能是中文
var oReg = /^[\u2E80-\u9FFF]+$/;

  3、身份证检测

// 18位身份证检测
 var oReg = /^\d{17}[\dxX]$/;

  4、日期检测

//日期检测
 var oReg = /^\d{4}(\-|\/)\d{1,2}\1\d{1,2}$/;

  5、去除首尾空格

// 去除首尾的空格
var sVal = oSpace.value;
var oReg = /^\s+(\S*)\s+$/;
console.log(sVal.replace(oReg, ‘$1‘));

  6、检测文件格式

//检测文件格式
var oReg = /.+\.(jpg|jpeg|png|gif)$/i;

  7、检测邮编

//检测邮编
var oReg = /^\d{6}$/;

  8、过滤

// 过滤
var str = ‘小明说小强是混蛋,小强说他不是混蛋‘;
str.replace(/混蛋/g, ‘**‘);

  

原文地址:https://www.cnblogs.com/MaShuai666/p/8401348.html

时间: 2024-10-28 22:16:46

正则表达式(轻松入门级)的相关文章

C#中使用正则表达式提取超链接地址的集中方法(转)

一般在做爬虫或者CMS的时候经常需要提取 href链接或者是src地址.此时可以使用正则表达式轻松完成. Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>"); MatchCollection mc = reg.Ma

Oracle10g新特性——正则表达式 - 转

在进行查询时,有时候需要按照一定的特殊规则来查找某个字符串,比如,你可能需要查询第三位为5-8,最后四位为’8888’的所有电话.在9i之前,你可能需要写一个很复杂的条件:Select username from t_userinfo where (phonenumber like ‘135%8888’ or phonenumber like ‘136%8888’ or phonenumber like ‘137%8888’ or phonenumber like ‘138%8888’) and

20. PoweShell - 正则表达式

·         PowerShell 正则表达式:三大类元素 字符:一个单独字符,或一个字符集合构成的字符串: 限定符:允许你在模式中决定字符或者字符串出现的频率: 定位符:允许你决定模式是否是一个独立的单词,或者出现的位置必须在句子的开头还是结尾: 元素 描述 . 匹配除了换行符意外的任意字符 [^abc] 匹配除了包含在中括号的任意字符 [^a-z] 匹配除了包含在中括号指定区间字符的任意字符 [abc] 匹配括号中指定的任意一个字符 [a-z] 匹配括号中指定的任意区间中的任意一个字符

C#中使用正则表达式提取超链接地址的集中方法

一般在做爬虫或者CMS的时候经常需要提取 href链接或者是src地址.此时可以使用正则表达式轻松完成. Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>"); MatchCollection mc = reg.Ma

HTML5前端入门教程:简析正则表达式

很多人对正则表达式的印象都是用来做表单验证的,这其实是不大准确的.正则表达式目前在很多软件中都得到了广泛的应用,包括Linux,Unix等操作系统,VB,Java,PHP等开发环境中,以及很多应用软件都能应用到正则表达式. 一.正则的历史 首先先来扫清一个误区,老是有人认为正则表达式是JS自己发明的,这当然是不正确的.1956年,一位名叫Stephen Kleene的数学家在McCulloch和pitts早期工作的基础上,发表了一篇标题为<神经网的表示法>的论文,第一次引入了正则表达式的概念.

项目工作中常见问题系列! 持续更新!

欧洲日期转标准或中文日期 欧洲大多数国家日期格式 24-12-1991  代表 dd-mm-yyyy 现在我想转换成中文日期格式1991年12月24日 或者转成国际标准格式日期 1991-12-24  yyyy-mm-dd格式 怎么解决呢? 这里我们可以通过正则表达式 轻松解决这个问题 static void Main(string[] args) { //定义一组欧洲日期列表 数据来源可能是一张数据表 或txt文本文件等.. var enDateList = new List<string>

轻松学习正则表达式

转载自:http://www.cnblogs.com/jamesping/articles/2252675.html 装载自:http://www.cnblogs.com/sxwgf/archive/2011/11/17/2252076.html 继续把我在个人博客上新翻译的文章投递到博客园来,这次是有关正则表达式的,很基础,主要是让读者把握住正则表达式中的3种括号的用法,用这3种括号几乎可以涵盖所有的正则式. 写在最前面 前两天我从CodeProject上翻译了一篇关于Javascript的文

轻松修改网站名---轻开电子商务系统(企业入门级B2C网站)

通过修改网站名能把系统定制给任何用户,满足用户占有的感觉,是非常巧妙而有用的小功能. 程序如下: 引入权限判断(管理员才有修改网站名的权限) <chtml><Bag id=sys><we name=NodeID>a0</we></Bag><!-- 栏目节点 --></chtml> <chtml file="base/ac/checkAcl.htm"/><!-- 引入权限检查文件 --&

轻松学习之Linux教程六 正则表达式详解

本系列文章由@超人爱因斯坦出品,转载请注明出处. 作者:超人爱因斯坦    个人网站:http://www.hpw123.net          文章链接:http://hpw123.net/a/Linux/Linuxjichu/2014/1101/104.html     邮箱: [email protected] CSDN:http://blog.csdn.net/u010283694 正则表达式是一些特殊字符的排列,用以查找.替换.删除一些或多行文字字符串,简单的说,正则表达式就是用在字