python 正则表达式规则收集

python正则表达式基本元字符

  1. .   通配符,匹配所有字符
  2. ^abc  匹配以abc开始的字符串
  3. abc$  匹配以abc结尾的字符串
  4. [abc]  匹配字符集合
  5. [A-Z0-9] 匹配字符范围
  6. ed|ing|s 匹配指定的字符串,诸如ed或者ing或者s
  7. *   前面项目0个或者多个,如a*/[a-z]* (也叫Kleene闭包)
  8. +   前面项目1个或者多个,如a+、[a-z]+
  9. ?   前面项目0个或者1个,如a?、[a-z]?
  10. {n}   重复n次
  11. {n,}  至少重复n次
  12. {,n}  重复不多于n次
  13. {m,n}  至少重复m次不多于n次
  14. a(b|c)+  括号表示操作符的范围
  15. 正则表达式符号:
  16. \b 词边界
  17. \d 任何数字等于[0-9]
  18. \D 任何非数字等于[^0-9]
  19. \s 任何空白字符[\t\n\r\f\v]
  20. \S 任何非空白字符[^\t\n\r\f\v]
  21. \w 任何字母[A-Za-z0-9]
  22. \W 任何非字母[^A-Za-z0-9]
  23. \t 制表符
  24. \n 换行符

相关正则知识:

  1. \d  匹配一个数字
  2. \w 匹配一个字母或者数字
  3. *  任意个字符(包括0个),
  4. +  至少一个字符
  5. ?  0个或1个字符
  6. {n} n个字符
  7. {n,m} n-m个字符
  8. \s 匹配一个空格
  9. \s+ 至少有一个空格
  10. \d{3,8} 表示3-8个数字,例如‘1234567‘
  11. \d{3}\s+\d{3,8}
  12. [0-9a-zA-Z\_] 匹配一个数字、字母或者下划线
  13. [0-9a-zA-Z\_]+ 匹配至少由一个数字、字母或者下划线组成的字符串,
  14. 比如‘a100‘,‘0_Z‘,‘Py3000‘等等;
  15. [a-zA-Z\_][0-9a-zA-Z\_]*可以匹配由字母或下划线开头,后接任意个由一个数字、字母或者下划线组成的字符串,也就是Python合法的变量
  16. [a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)
  17. A|B可以匹配A或B,所以(P|p)ython可以匹配‘Python‘或者‘python‘
  18. ^表示行的开头,^\d表示必须以数字开头
  19. 表示行的结束,\d
  1. 表示必须以数字结束

参考自:微信公众号,数据挖掘入门与实战

时间: 2024-10-11 23:01:51

python 正则表达式规则收集的相关文章

Python 正则表达式规则

正则表达式的一些匹配规则: . :用于匹配任意一个字符,如 a.c 可以匹配 abc .aac .akc 等^ :用于匹配以...开头的字符,如 ^abc 可以匹配 abcde .abcc .abcak 等$ :用于匹配以...结尾的字符,如 abc$ 可以匹配 xxxabc .123abc 等* :匹配前一个字符零次或多次,如 abc* 可以匹配 ab .abc .abcccc 等+ :匹配前一个字符一次或多次,如 abc+ 可以匹配 abc .abcc .abcccc 等? :匹配前一个字符

Python正则表达式Regular Expression基本用法

资料来源:http://blog.csdn.net/whycadi/article/details/2011046   直接从网上资料转载过来,作为自己的参考.这个写的很清楚.先拿来看看. 1.正则表达式re模块的基本函数. (1)findall函数的用法 findall(rule,target[,flag])是在目标字符串中找到符合规则的字符串.参数说明:rule表示规则,target表示目标字符串,[,flag]表示的是规则选项.返回的结果是一个列表.若没找到符合的,是一个空列表. 如: 因

python正则表达式re

1. 正则表达式简介 正则表达式并不是Python的一部分.在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别 只在于不同的编程语言实现支持的语法数量不同:但不被支持的语法通常是不常用的部分.python正则表 达式是用于文本匹配的强大工具,在源字符串中查找与给定的正则表达式相匹配的部分.一个正则表达式 是由字母.数字和特殊字符(括号.星号和问号等)组成. 正则表达式中的特殊字符:^      正则表达式的开始字符$      正则表达式的结束字符\w     匹配字母.数字.下划线,

Python——正则表达式(5)

本文译自官方文档: Regular Expression HOWTO 参考文章: Python--正则表达式(1) Python--正则表达式(2) Python--正则表达式(3) Python--正则表达式(4) 全文下载: Python正则表达式基础 ====================================================================================== 6.常见问题 正则表达式在应用中是非常强大的工具,但有时候它们并不能

Python 正则表达式入门(初级篇)

本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达式.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式使用单个字符串来描述.匹配一系列匹配某个句法规则的字符串.在很多文本编辑器里,正则表达式通常被用来检索.替换那些匹配某个模式的文本. 许多程序设计语言都支持利用正则表达式进行字符串操作.例如,在Pe

八、Python正则表达式

Python正则表达式 一.正则表达式(或RE)是一种小型的.高度专业化的编程语言 --- 可以为想要匹配的相应字符串集指定规则 --- 该字符串集可能包含英文语句.e-mail地址.命令或者任何你想搞定的东西 --- 可以问诸如"这个字符串匹配该模式吗?" --- "在这个字符串中是否有部分匹配该模式呢?" --- 你也可以使用RE以各种方式来修改或分割字符 正则表达式模式被编译成一系列的字节码,然后有用C编写的匹配引擎执行 正则表达式语言相对小型和受限(功能有限

python 正则表达式 re.sub & re.subn

python正则表达式模块简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 Emacs 风格的模式.Emacs 风格模式可读性稍差些,而且功能也不强,因此编写新代码时尽量不要再使用 regex 模块,当然偶尔你还是可能在老代码里发现其踪影. 就其本质而言,正则表达式(或 RE)是一种小型的.高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现.使用这个小型语言

Python 正则表达式入门

Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写.转载请写明出处 中级篇介绍子表达式,向前向后查找,回溯引用 链接:http://www.cnblogs.com/chuxiuhong/p/5907484.html 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达式.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式使用单个字符

Python学习:13.Python正则表达式

一.正则表达式简介 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. 就其本质而言,正则表达式(或 RE)是一种小型的.高度专业化的编程语言, (在Python中)它内嵌在Python中,并通过 re 模块实现.正则表达式模式被 编译成一系列的字节码,然后由用 C 编写的匹配引擎执行. re 模块使 Python 语言拥有全部的正则表达式功能. compile 函数根据一个模