正则表达式与特殊符号

特殊符号

[:alnum:] 代表英文大小写字符及数字，即 0-9,
A-Z, a-z

[:alpha:] 代表任何英文大小写字符，即 A-Z,
a-z

[:upper:] 代表大写字符，即 A-Z

[:lower:] 代表小写字符，即 a-z

[:digit:] 代表数字而已，即 0-9

[:xdigit:] 代表 16 进制数字类型，因此包括： 0-9, A-F, a-f 的数字与字符

[:blank:] 空格与Tab

[:space:] 任何会产生空白的字符，包括空格键,
[Tab], CR 等等

[:graph:] 除了空格符（空格和Tab键）外的其他所有按键

[:cntrl:] 控制按键，包括 CR（换行）, LF（换行）, Tab, Del.. 等等

[:print:] 代表任何可以被打印的字符

[:punct:] 代表标点符号 (punctuation symbol)，即：" ‘ ? ! ; : # $...

RE 字符

^word

待搜索的字符串word在行首

eg：grep ‘^hello‘ test.txt 表示test.txt中以hello开头的行

注：^word与[^word]意义相差极大

word$

带搜索的字符串word在行尾

eg：
grep ‘!$‘ test.txt 表示test.txt中以感叹号！结尾的行

含一个任意字符，有且仅有一个字符（可以使空格）

grep ‘a.a‘ test.txt
表示test.txt中两个a中间可以使任意一个字符的行，不能是‘aa‘

注：笔者测试时换行符是不算的，

eg：grep ‘aa.‘ test.txt 以[^a]*aa结尾的行市不算的

转义字符，跟C语言一样

grep -n \‘ test.txt 表示test.txt中含单引号‘的行

重复0到无穷多次前一个字符

eg：grep go*gle test.txt 表示gogle，google，gooogle，gooo...gle

[list]

要选取的字符集合

eg：grep ‘l[ace]‘ test.txt 表示test.txt中含有la或lb或lc的行

[n1-n2]

要搜索的字符范围

eg：grep ‘[0-9]‘ test.txt 表示含有任意数字字符的行

[^list]

反向选择范围

eg：grep ‘[^0-9]‘
test.txt 表示含有任意非数字字符的行

eg：grep ‘l[^ace]‘
test.txt 表示含有l后面接任意一个不是a，b，c的字符的行

注：[list]和[^list]并不是互为补集

行abcd1234既属于grep ‘[0-9]‘
test.txt 又属于grep ‘[^0-9]‘
test.txt

行abcd1234既属于grep ‘[ace]‘ test.txt
又属于grep ‘[^ace]‘ test.txt

\{n,m\} \{n\}

\{n\} 表示重复n次前一个字符

\{n,m\} 表示重复n到m次前一个字符

grep ‘go\{2\}gle‘ test.txt 表示 gooogle

grep ‘go\{1,3\}gle‘
test.txt 表示 google或者gooogle，或者goooogle

正则表达式与特殊符号

时间： 2025-01-21 19:56:35

正则表达式与特殊符号的相关文章

正则表达式中的符号含义

. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束[\u4e00-\u9fa5]{2,20} 匹配2-20个汉字* 重复零次或更多次+ 重复一次或更多次? 重复零次或一次{n} 重复n次{n,} 重复n次或更多次{n,m} 重复n到m次\W 匹配任意不是字母,数字,下划线,汉字的字符\S 匹配任意不是空白符的字符\D 匹配任意非数字的字符\B 匹配不是单词开头或结束的位置[^x]

[Z]正则表达式中的符号

. 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 [\u4e00-\u9fa5]{2,20} 匹配2-20个汉字 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S 匹配任意不是空白符的字符 \D 匹配任意非数字的字符 \B 匹配

JS正则表达式之特殊符号

在正则表达式中,许多标点符号具有特殊含义,比较难记,现归纳备个份: 这些符号有:^ $ . * + - ? = ! : | \ / ( ) [ ] { } 1."[ ]"表示字符类: 即括号里是个字符集:如/[abc]/,表示和含有a,b,c任何一个字母的字符串都匹配. 注:特殊字符类:\s表示空格符.制表符.Unicode空白符.\S表示非Unicode空白符.(也可自定义Unicode字符类:如: /[\u4E00-\u9FA5]/表示只匹配中文字符.) \w 任何单字字符,相当

正则表达式之全部符号对照表

字符描述 \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个向后引用.或一个八进制转义符.例如,'n' 匹配字符 "n".'\n' 匹配一个换行符.序列 '\\' 匹配 "\" 而 "\(" 则匹配 "(". ^ 匹配输入字符串的开始位置.如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置. $ 匹配输入字符串的结束位置.如果设置了RegExp 对象的 Mul

正则表达式的全部符号解释

【关于正则表达式的特殊符号的处理】之前自己在提取一个表达式一直提取不到，后来解决了，记录下知识点

1.开始的表达式:"drugLicenseCompanyperson":[{"pk":"(.*?)" 2.修改后的表达式:"drugLicenseCompanyperson":\[\{"pk":"(.*?)" 这里就是对 [ 和{ 这样的符号未做处理 ------------------------来自菜鸟教程-------------------------------- 特殊字符所

iOS 正则表达式去除特殊符号

1.众所周知,正则表达式如果利用得当的话,其实用性还是相当强大的 ,基本上目前所有的预研都是支持正则表达式的 ,无非是对语法的支持不同. 2.在实际应用中 ,我们可能需要去截取遇到第一个特殊字符之前的文字 ,此时就需要用到正则表达式 ,毕竟特殊符号那么多 ,如果真有人用多个if去操作的话,只能说刷新了我的认知! 话不多说,附上代码 - (NSString *)getNewSubStoreNameByRegularExpression:(NSString *)storeName{ NSError

正则表达式常用的符号和字符

re1|re2 匹配正则表达式 re1 或 re2 . 匹配任何字符(换行符除外) ^ 匹配字符串开始 $ 匹配字符串结尾 * 匹配前面出现的正则表达式“0次或多次” +

正则表达式中常用符号

一: 正则在Perl.Py森.Ruby.Java等语言中文本的正则表达式几乎是一样的以前常用到的在网上都有现成的例子拿来用,比如电话格式.邮箱格式之类的. 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼. 在<自然语言处理简明教程>里面有很系统的正则表达式教程,特意总结出来消化吸收. 二: 双斜线“//” 最简单的正则表达式就是这样的,由类似于/hello world /的正则来搜索语料库中包含子字符串“hello