正则表达式与特殊符号

特殊符号

[:alnum:]  代表英文大小写字符及数字,即  0-9,
A-Z, a-z

[:alpha:]  代表任何英文大小写字符,即  A-Z,
a-z

[:upper:]  代表大写字符,即  A-Z

[:lower:]  代表小写字符,即  a-z

[:digit:]  代表数字而已,即 0-9

[:xdigit:]  代表 16 进制数字类型,因此包括: 0-9, A-F, a-f 的数字与字符

[:blank:]  空格与Tab

[:space:]  任何会产生空白的字符,包括空格键,
[Tab], CR 等等

[:graph:]  除了空格符(空格和Tab键)外的其他所有按键

[:cntrl:]  控制按键,包括 CR(换行), LF(换行), Tab, Del.. 等等

[:print:]  代表任何可以被打印的字符

[:punct:]  代表标点符号 (punctuation symbol),即:" ‘ ? ! ; : # $...

RE 字符

^word

待搜索的字符串word在行首

eg:grep ‘^hello‘  test.txt 表示test.txt中以hello开头的行

 注:^word与[^word]意义相差极大

word$

带搜索的字符串word在行尾

eg:
grep ‘!$‘   test.txt    表示test.txt中以感叹号!结尾的行

.

含一个任意字符,有且仅有一个字符(可以使空格)

grep ‘a.a‘    test.txt 
  表示test.txt中两个a中间可以使任意一个字符的行,不能是‘aa‘

 注:笔者测试时换行符是不算的

eg:grep ‘aa.‘  test.txt   以[^a]*aa结尾的行市不算的

\

转义字符,跟C语言一样

grep -n \‘  test.txt 表示test.txt中含单引号‘的行

*

重复0到无穷多次前一个字符

eg:grep go*gle test.txt     表示gogle,google,gooogle,gooo...gle

[list]

要选取的字符集合

eg:grep ‘l[ace]‘ test.txt     表示test.txt中含有la或lb或lc的行

[n1-n2]

要搜索的字符范围

eg:grep  ‘[0-9]‘ test.txt 表示含有任意数字字符的行

[^list]

反向选择范围

eg:grep  ‘[^0-9]‘
test.txt 表示含有任意非数字字符的行

eg:grep  ‘l[^ace]‘
test.txt 表示含有l后面接任意一个不是a,b,c的字符的行

     注:[list]和[^list]并不是互为补集

行abcd1234既属于grep  ‘[0-9]‘
test.txt 又属于grep  ‘[^0-9]‘
test.txt

行abcd1234既属于grep  ‘[ace]‘ test.txt
又属于grep  ‘[^ace]‘ test.txt

\{n,m\}      \{n\}

\{n\} 表示重复n次前一个字符

\{n,m\} 表示重复n到m次前一个字符

grep ‘go\{2\}gle‘  test.txt 表示 gooogle

grep ‘go\{1,3\}gle‘
 test.txt 表示 google或者gooogle,或者goooogle

正则表达式与特殊符号

时间: 2025-01-21 19:56:35

正则表达式与特殊符号的相关文章

正则表达式中的符号含义

. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束[\u4e00-\u9fa5]{2,20} 匹配2-20个汉字* 重复零次或更多次+ 重复一次或更多次? 重复零次或一次{n} 重复n次{n,} 重复n次或更多次{n,m} 重复n到m次\W 匹配任意不是字母,数字,下划线,汉字的字符\S 匹配任意不是空白符的字符\D 匹配任意非数字的字符\B 匹配不是单词开头或结束的位置[^x]

[Z]正则表达式中的符号

. 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 [\u4e00-\u9fa5]{2,20} 匹配2-20个汉字 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S 匹配任意不是空白符的字符 \D 匹配任意非数字的字符 \B 匹配

JS正则表达式之特殊符号

在正则表达式中,许多标点符号具有特殊含义,比较难记,现归纳备个份: 这些符号有:^ $ . * +  - ? = ! : | \ / ( ) [ ] { } 1."[ ]"表示字符类: 即括号里是个字符集:如/[abc]/,表示和含有a,b,c任何一个字母的字符串都匹配. 注:特殊字符类:\s表示空格符.制表符.Unicode空白符.\S表示非Unicode空白符.(也可自定义Unicode字符类:如: /[\u4E00-\u9FA5]/表示只匹配中文字符.) \w 任何单字字符,相当

正则表达式之全部符号对照表

字符 描述 \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个 向后引用.或一个八进制转义符.例如,'n' 匹配字符 "n".'\n' 匹配一个换行符.序列 '\\' 匹配 "\" 而 "\(" 则匹配 "(". ^ 匹配输入字符串的开始位置.如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置. $ 匹配输入字符串的结束位置.如果设置了RegExp 对象的 Mul

正则表达式的全部符号解释

字符 描述 \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个 向后引用.或一个八进制转义符.例如,'n' 匹配字符 "n".'\n' 匹配一个换行符.序列 '\\' 匹配 "\" 而 "\(" 则匹配 "(". ^ 匹配输入字符串的开始位置.如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置. $ 匹配输入字符串的结束位置.如果设置了RegExp 对象的 Mul

【关于正则表达式的特殊符号的处理】之前自己在提取一个表达式一直提取不到,后来解决了,记录下知识点

1.开始的表达式:"drugLicenseCompanyperson":[{"pk":"(.*?)" 2.修改后的表达式:"drugLicenseCompanyperson":\[\{"pk":"(.*?)" 这里就是对 [ 和{ 这样的符号未做处理 ------------------------来自菜鸟教程-------------------------------- 特殊字符 所

iOS 正则表达式去除特殊符号

1.众所周知,正则表达式如果利用得当的话,其实用性还是相当强大的 ,基本上目前所有的预研都是支持正则表达式的 ,无非是对语法的支持不同. 2.在实际应用中 ,我们可能需要去截取遇到第一个特殊字符之前的文字 ,此时就需要用到正则表达式 ,毕竟特殊符号那么多 ,如果真有人用多个if去操作的话,只能说刷新了我的认知! 话不多说,附上代码 - (NSString *)getNewSubStoreNameByRegularExpression:(NSString *)storeName{ NSError

正则表达式常用的符号和字符

re1|re2                       匹配正则表达式 re1 或 re2 .                                  匹配任何字符(换行符除外) ^                                匹配字符串开始 $                                匹配字符串结尾 *                                 匹配前面出现的正则表达式“0次或多次” +                

正则表达式中常用符号

一: 正则在Perl.Py森.Ruby.Java等语言中文本的正则表达式几乎是一样的 以前常用到的在网上都有现成的例子拿来用,比如电话格式.邮箱格式之类的. 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼. 在<自然语言处理简明教程>里面有很系统的正则表达式教程,特意总结出来消化吸收. 二: 双斜线“//” 最简单的正则表达式就是这样的,由类似于/hello world /的正则来搜索语料库中包含子字符串“hello