re模块\正则表达式
一、元字符
1、. ^ $ * + ? { } [ ] | ( ) \
"." 代表(任意一个字符) "*" 代表(任意数量任意字符,0-无穷) "+" 代表(任意一个或无数字符,1-无穷) "?" 代表(0或1个字符) "^" 代表(字符串开头) "$" 代表(字符串结尾) "{}" 代表(指定次数)
2、转义符 \
1)、反斜杠后边跟元字符去除特殊功能,比如\.
2)、反斜杠后边跟普通字符实现特殊功能,比如\d
\d 匹配任何十进制数; 它相当于类 [0-9]。 \D 匹配任何非数字字符; 它相当于类 [^0-9]。 \s 匹配任何空白字符; 它相当于类 [ \t\n\r\f\v]。 \S 匹配任何非空白字符; 它相当于类 [^ \t\n\r\f\v]。 \w 匹配任何字母数字字符; 它相当于类 [a-zA-Z0-9_]。 \W 匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_] \b 匹配一个特殊字符边界,比如空格 ,&,#等
3、分组 ()
ret = re.findall("(yuan)+","lalal11yuanhao22yuanyuanhaohao33yuan") #分组(),用findall命令返回的是分组内容 print(ret) #[‘yuan‘, ‘yuan‘, ‘yuan‘]
时间: 2024-10-11 02:54:51