正则表达式中常用的元符号


^


一行的开始标志如^bigeyyes匹配到所有以bigeyyes开头的行


$


一行的结束标志如$bigeyyes 匹配到所有以bigeyyes结尾的行


?或 .


匹配任意一个非换行字符,如big?eyes匹配到big后接一个任意字符,然后是eyyes的行


*


匹配任意0个或者多个字符


[xxx]或[x-x]


匹配字符集或者某一范围内的一个字符,如seq[01]匹配一行中所有seq0或者seq1;

[xxx]可以罗列非连续的字符([afgi])[x-x]可以罗列连续字符([a-g])


[^]


匹配一个不再指定范围内的字符,比如seq[^01]匹配不包含seq0或者seq1的行


\(..\)


标记匹配字符如\(bigeyes\)可使所有匹配行中的bigeyes被标记为1


\<


单词的开始标志如\<big匹配包含以big开头的单词的行


\>


单词的结束标志如end\>匹配包含以end结束的单词的行


X\{m\}


重复x字符m次如r\{5\}匹配包含5个r字符的行


X\{m,\}


重复x字符至少m次如r\{5\}匹配包含至少5个r字符的行


X\{m,n\}


重复x字符至少m次但又不多于n次,如r\{1,10\}匹配1—10个r字符的行


\w


匹配文字和数字,既[A-Za-z0-9],如big\w*eyes匹配以big后跟0个或多个文字或数字的字符,然后是eyes的行


\W


匹配非文字和非数字的字符(点号句号等)如bigeyes\W匹配以bigeyes后跟非文字和数字字符的行

时间: 2024-10-14 23:30:08

正则表达式中常用的元符号的相关文章

shell中常用的特殊符号

在shell中常用的特殊符号罗列如下: # ; ;; . , / \ 'string'| ! $ ${} $? $$ $* "string"* ** ? : ^ $# [email protected] `command`{} [] [[]] () (()) || && {xx,yy,zz,...}~ ~+ ~- & \<...\> + - %= == != # 井号 (comments) 注释字符 该句不会被执行 ~ 帐户的 home 目录 用户的

正则表达式中常用的模式修正符有i、g、m、s、x、e详解

正则表达式中常用的模式修正符有i.g.m.s.x.e等.它们之间可以组合搭配使用. 它们的作用如下: //修正符:i 不区分大小写的匹配; //如:"/abc/i"可以与abc或aBC或ABc等匹配; //修正符:g表示全局匹配 //修正符:m 将字符串视为多行,不管是那行都能匹配; 例://模式为:$mode="/abc/m"; //要匹配的字符串为:$str="bcefg5e\nabcdfe" //注意其中\n,换行了;abc换到了下一行;

正则表达式中常用符号

一: 正则在Perl.Py森.Ruby.Java等语言中文本的正则表达式几乎是一样的 以前常用到的在网上都有现成的例子拿来用,比如电话格式.邮箱格式之类的. 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼. 在<自然语言处理简明教程>里面有很系统的正则表达式教程,特意总结出来消化吸收. 二: 双斜线“//” 最简单的正则表达式就是这样的,由类似于/hello world /的正则来搜索语料库中包含子字符串“hello

正则表达式中原子的5种类型

原子是正则表达式的最基本的组成单位,而且在每个模式中最少包含一个原子.原子是由所有那些未显示指定为元字符的打印和非打印字符组成,所以在这里将其详细划分为五类进行介绍. ①普通字符作为原子 普通字符是编写正则表达式时最常见的原子了,包括所有的大写和小写字母字符.所有数字等.例如,a——z.A——Z.0——9. ’/5/’        –用于匹配字符串中是否有5这个字符出现 ’/php/’      –用于匹配字符串中是否有PHP字符串出现 ②一些特殊字符和元字符作为原子 任何一个符号都可以作为原

正则表达式中模式修正符作用详解(i、g、m、s、x、e)

正则表达式中常用的模式修正符有i.g.m.s.x.e等.它们之间可以组合搭配使用. 它们的作用如下: //修正符:i 不区分大小写的匹配; //如:"/abc/i"可以与abc或aBC或ABc等匹配; //修正符:g表示全局匹配 //修正符:m 将字符串视为多行,不管是那行都能匹配; 例://模式为:$mode="/abc/m";          //要匹配的字符串为:$str="bcefg5e\nabcdfe"              //

ios中常用到的正则表达式

一.常用的正则表达式 可以到github上下载我封装好的类方法直接使用,顺便给我点个星,谢谢! 以下字符串是常用的正则表达式(以下正则表达式来自百度百科) 1.验证用户名和密码:"^[a-zA-Z]\w{5,15}$" 2.验证电话号码:("^(\\d{3,4}-)\\d{7,8}$") eg:021-68686868  0511-6868686: 3.验证手机号码:"^1[3|4|5|7|8][0-9]\\d{8}$": 4.验证身份证号(15

工作中常用的正则表达式

正则表达式中的常用符号 ^ 匹配输入字符串的开始位置. $ 匹配输入字符串的结束位置. * 匹配前面的子表达式零次或多次. \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个后向引用.或一个八进制转义符. + 匹配前面的子表达式一次或多次.+ 等价于 {1,}. ? 匹配前面的子表达式零次或一次.? 等价于 {0,1}. \d 匹配一个数字字符.等价于 [0-9]. \s 匹配任何空白字符,包括空格.制表符.换页符等等.等价于[ \f\n\r\t\v]. i 表示模式中的字母会进行大小写

正则表达式中的符号含义

. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束[\u4e00-\u9fa5]{2,20} 匹配2-20个汉字* 重复零次或更多次+ 重复一次或更多次? 重复零次或一次{n} 重复n次{n,} 重复n次或更多次{n,m} 重复n到m次\W 匹配任意不是字母,数字,下划线,汉字的字符\S 匹配任意不是空白符的字符\D 匹配任意非数字的字符\B 匹配不是单词开头或结束的位置[^x]

JavaScript 中常用的 正则表达式

这编文章我来整理了一些在 javascript 中常用的正则式希望能给大家带来一些开发的灵感 //校验是否全由数字组成 function isDigit(s) { var patrn=/^[0-9]{1,20}$/; if (!patrn.exec(s)) return false return true } 匹配中文字符的正则表达式: [u4e00-u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^x00-xff]评注:可以用来计算字符串的