Python 深入正则表达式

#!/usr/bin/env python3import re

‘‘‘#常用功能介绍

[Pp]ython  匹配 "Python" 或 "python"rub[ye]    匹配 "ruby" 或 "rube"[aeiou]    匹配中括号内的任意一个字母[0-9]  匹配任何数字。类似于 [0123456789][a-z]  匹配任何小写字母[A-Z]  匹配任何大写字母[a-zA-Z0-9]    匹配任何字母及数字[^aeiou]   除了aeiou字母以外的所有字符[^0-9] 匹配除了数字外的字符

.  匹配除 "\n" 之外的任何单个字符。要匹配包括 ‘\n‘ 在内的任何字符，请使用象 ‘[.\n]‘ 的模式。\d 匹配一个数字字符。等价于 [0-9]。\D 匹配一个非数字字符。等价于 [^0-9]。\s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。\w 匹配包括下划线的任何单词字符。等价于‘[A-Za-z0-9_]‘。\W 匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]‘。‘‘‘

strings = ‘1k3jksl24kljzdio43ndsfoi4nsadf‘

#re.compile() : complie()先将需要匹配的对象进行编译，好处是 提高执行速度

re_complie=re.compile("[0-9]+")

#match 从整个对象的开头开始匹配,返回的类型是字符串sb = re_complie.match(strings)print(sb.group())

#search 在整个对象中查找，找到第一个就返回值，返回的类型是字符串sb = re_complie.search(strings)print(sb.group())

#findall 在整个对象中查找，返回一个列表sb = re_complie.findall(strings)print(sb)

#re.split(): split()用户分割对象#split 将匹配到的格式当做分割点对字符串分割成列表sb = re_complie.split(strings)print(sb)

#sub 替换匹配到的字符#count 指定替换多少个；例如本例中找到5个元素，指定替换四个元素sb = re_complie.sub("|",strings,count=4)print(sb)

#实例1: 匹配手机号

phone_number = ‘my name is andy , my phone number is 13162156638 , your call me andy‘p_number= re.search("(1)[3458][0-9]{9}",phone_number)  #方法一p_number= re.search("(1)[3458]\d{9}",phone_number)     #方法二print(p_number)

#实例2: 匹配IP地址ipaddress = "inet 192.168.60.223 netmask 0xffffff00 broadcast 192.168.60.255"ip = re.search("(\d{3}.){2}(\d{1,3}.){2}",ipaddress) #方法一ip = re.search("(\d{1,3}.){4}",ipaddress)            #方法二print(ip.group())

#实例3: 分组匹配

message = ‘Oldboy School, Beijing Changping Shahe: 010-8343245‘match = re.search(r‘(\w+) (\w+) (\S+)‘,message)

print(match.group())

#实例3: 匹配email地址

message = ‘[email protected] http://blog.163.com‘emails = "[email protected]   http://www.oldboyedu.com"

email = re.search("[a-zA-z0-9][email protected][0-9]+\.com",message)m = re.search(r"[0-9.a-z]{0,26}@[0-9.a-z]{0,20}.[0-9a-z]{0,8}", emails)print(email.group())print(m.group())

时间： 2024-10-11 16:45:03

Python 深入正则表达式的相关文章

python 中正则表达式

. 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束代码/语法说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 [aeiou]就匹配任何一个英文元音字母,[.?!]匹配标点符号(.或?或!). [0-9]代表的含意与\d就是完全一致的:一位数字:同理[a-z0-9A-Z_]也完

python用正则表达式怎么查询unicode码字符

import re data = open('a.txt') fh = open('b.txt', 'w') """Search the string begining with '['""" p = re.compile(r'\s*[\u3010]') for each_d in data: if re.match('\s*3\d{4}', each_d): each_d = each_d.strip() print(each_d + ': '

【python】正则表达式

在python中,所有和正则表达式相关的功能都包含在re模块中. $表示字符串的末尾,^表示字符串的开始,原始字符串:字符串添加前缀r,表示字符串中的所有字符都不转义.\b表示单词的边界必须在这里. s="100 BROAD" re.sub('ROAD$','RD',s) 结果:'100 BRD' re.sub(r'\bROAD$','RD',s) 结果:100 BROAD M?可选地匹配单个字符,要么一个M,要么没有M.re模块的关键是一个search函数,该函数由两个参数,一个是正

python使用正则表达式文本替换

2D客户端编程从某种意义上来讲就是素材组织,所以,图片素材组织经常需要批量处理,python一定是最佳选择,不过是win/linux/mac都有一个简单的运行环境举两个应用场景: 如果不是在某个文件夹里面则将文件夹名称插入前面所有的文件名名称加上一个前缀直接看代码吧 # encoding: UTF-8 import re # 将正则表达式编译成Pattern对象 p = re.compile(r'(?P<folder>(\w+/)*)(?P<filename>\w+\.png

Python使用正则表达式替换源码前序号

从博客园或其它地方拷贝代码,经常前面有代码序号,像下面这个样子: 1 wbContent.Navigate(vURL); 2 3 Result:=GetHtml(wbContent); 4 5 while not ContainsText(Result,'共找到') do 6 begin 7 Sleep(100); 8 Application.ProcessMessages; 9 Result:=GetHtml(wbContent)

python study - 正则表达式

第 7 章正则表达式 7.1. 概览 7.2. 个案研究:街道地址 7.3. 个案研究:罗马字母 7.3.1. 校验千位数 7.3.2. 校验百位数 7.4. 使用 {n,m} 语法 7.4.1. 校验十位数和个位数 7.5. 松散正则表达式 7.6. 个案研究:解析电话号码 7.7. 小结正则表达式是搜索.替换和解析复杂字符模式的一种强大而标准的方法.如果你曾经在其他语言 (如 Perl) 中使用过它,由于它们的语法非常相似,你仅仅阅读一下 re 模块的摘要,大致了解其中可用的函数和参数就

Python爬虫-正则表达式

正则表达式只提取关注的数据,进行数据赛选原子: 基本组成单位普通的字符非打印支付通用字符普通的字符 >>> import re >>> pat="yue" >>> string="http://yum.iqianyue.com" >>> rst1=re.search(pat,string) >>> print(rst1) <_sre.SRE_Match obj

python的正则表达式 re

python的正则表达式 re 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮. 正则表达式使用反斜杆(\)来转义特殊字符,使其可以匹配字符本身,而不是指定其他特殊的含义.这可能会和python字面意义上的字符串转义相冲突,这也许有些令人费解.比如,要匹配一个反斜杆本身,你也许要用'\\\\'来做为正则表达式的字符串,因为正则表达式要是\\,而字符串里,每个反斜杆都要写

Python re正则表达式模块学习【转】

感谢原作者,本文转自:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 博主还有一些比较好的python文档在此一并推荐,可以移步查看. 文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程. 注意:本文基于Python2.4完成:如果看到不明白的词汇请记得百度谷歌或维基,whate

[python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】

[python] 常用正则表达式爬取网页信息及分析HTML标签总结转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pythonpython爬虫正则表达式html知识总结 2016-04-07 06:13 3615人阅读评论(4) 收藏举报分类: Python爬虫(23) Python基础知识(17) 版权声明:本文为博主原创文章,转载请注明CSDN博客源地址!共同学习,一起进步~ 这篇文章主要是介绍Pytho