大话Python正则表达式

python的正则表达式模块re

import re

match_object=re.compile(r"")

result=re.match(match_object,"resource string") 

result=re.search(match_object,"resource string")

result=re.findall(match_object,"resource string") # 注意区别

match_object.match("resource string").group()

match_object.search("resource string").group()

match_object.findall("resource string")           #上下两种方式任选一种,findall是返回列表
print result.group()

match()与search()的区别:

match是从源字符串头开始,仅当从头开始匹配成功,才能成功从一串字符串中匹配到目标字符串

rearch是从源字符串任意位置开始匹配

match和search的共同点是一旦匹配成功就返回,因而只会从源字符串中成功匹配一个目标字符串

findall 是将源字符串中的所有匹配的目标字符串,以列表的形式返回

match_object=re.compile(r"") # r 表示原字符串,比如存在"\"字符时,"\"不再表示转义的意思,而是 保持本身作为一个普通字符串的含义

"\"用在字符串中的意思是转义,例如"\\n"不再表示换行符,而是普通字符"\n"

print "\n"     #输出换行

print "\\n"
\n             #输出普通字符,没有换行意思
print r"\n"
\n             #输出普通字符,没有换行意思
print r"\\n"
\\n            #输出普通字符

match_object=re.compile(r"")

匹配目标,正则表达式定义:

"\d{}"  "\d"匹配数字,"{}"表示匹配的个数,{5}匹配5个,{1,}至少匹配1个,{3,8}匹配3至8个;

"^" 以什么开始

"$" 以什么结束

"[0-9a-z]" 匹配[]中包含的一个字符

"[^0-9]"    表示匹配非数字的字符串,"^"用在[]里面不再表示以什么开始,而是表示非

"你|我|他"  "|"表示"或"的意思

"?" 表示匹配次数要么为0,要么为1

"*" 表示匹配任一次数,即是0次或0次以上

"+"表示至少匹配一次

"*?" 表示非贪婪匹配  即是尽可能少的匹配

p = re.compile(r‘woyouy*?‘)
result = re.match(p, ‘woyouyyyyyyy‘)
print result.group()
woyou

"." 通配符,可以表示除换行以外的所有字符,如果加上re.DOTALL,使"."什么都可以匹配,还有re.IGNORECASE,re.VERBOSE

re.VERBOSE 可以排除注释和空白字符

p = re.compile(r‘good.haha‘, re.DOTALL)
result = re.findall(p, ‘good\nhaha‘)
print  result
[‘good\nhaha‘]

p = re.compile(r‘good.haha‘, re.IGNORECASE | re.DOTALL)
result = re.findall(p, ‘GOOD\nHahA‘)
print result
[‘GOOD\nHahA‘]

p = re.compile(r‘‘‘
    \w+. # asdf
    \w+‘‘‘ #12
           ,re.IGNORECASE | re.DOTALL | re.VERBOSE)
result = re.findall(p, ‘GOOD\nHahA‘)
print result
[‘GOOD\nHahA‘]

"\w" 表示匹配单词,它是包括数字的

"\s" 表示匹配红白/换行/制表符

分割字符串:

p = re.compile(r‘\d+‘)
 result = re.split(p, ‘tom32jerry456haha‘)
print result
[‘tom‘, ‘jerry‘, ‘haha‘]

替换字符串:

p = re.compile(r‘\d+‘)
result = re.sub(p, ‘replace‘, ‘tom32jerry456haha‘)
prinr result
tomreplacejerryreplacehaha
时间: 2024-10-06 08:20:54

大话Python正则表达式的相关文章

Python正则表达式Regular Expression基本用法

资料来源:http://blog.csdn.net/whycadi/article/details/2011046   直接从网上资料转载过来,作为自己的参考.这个写的很清楚.先拿来看看. 1.正则表达式re模块的基本函数. (1)findall函数的用法 findall(rule,target[,flag])是在目标字符串中找到符合规则的字符串.参数说明:rule表示规则,target表示目标字符串,[,flag]表示的是规则选项.返回的结果是一个列表.若没找到符合的,是一个空列表. 如: 因

python正则表达式re

1. 正则表达式简介 正则表达式并不是Python的一部分.在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别 只在于不同的编程语言实现支持的语法数量不同:但不被支持的语法通常是不常用的部分.python正则表 达式是用于文本匹配的强大工具,在源字符串中查找与给定的正则表达式相匹配的部分.一个正则表达式 是由字母.数字和特殊字符(括号.星号和问号等)组成. 正则表达式中的特殊字符:^      正则表达式的开始字符$      正则表达式的结束字符\w     匹配字母.数字.下划线,

python正则表达式详解

python正则表达式详解 正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能不一样,不过只要学会了任意一门语言的正则表达式用法,其他语言中大部分也只是换了个函数的名称而已,本质都是一样的.下面,我来介绍一下python中的正则表达式是怎么使用的. 首先,python中的正则表达式大致分为以下几部分: 元字符 模式 函数 re 内置对象用法 分组用

python正则表达式

本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程. 注意:本文基于Python2.4完成:如果看到不明白的词汇请记得百度谷歌或维基,whatever. 尊重作者的劳动,转载请注明作者及原文地址 >.<html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法

python 正则表达式基础

又一段时间没写博客了 最近一段时间在写pygame 又忽略了博客 今天因要帮朋友修改电影字幕 用到了正则表达式 重新学了一遍 发现还是得多练 才能算渐渐掌握 python 正则表达式 1.1介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大.得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同:但不用担心,不被支持

python正则表达式-findall

python正则表达式-findall #coding=utf-8 import re ''' # 获取匹配的的内容 ''' p = re.compile(r'\d+') print '找出所有的数字',p.findall('one1two2three3four4') ''' # 获取匹配的的内容-比较复杂的例子 ''' unicodePage ='<div class="content" title="2015-02-22 00:08:46">i am

Python正则表达式 re(regular expression)

1. 点. .: 代表一个字符 (这个跟linux的正则表达式是不同的,那里.代表的是后面字符的一次或0次出现) 2. 转义 \\ 或者 r'\': 如 r'python\.org' (对.符号的转义) 3. ^ 非或叫做排除 如[^abc]: 任何以非a,b,c的字符 4. | 选择符 如python|perl (从python和perl选择一个) 也可以: p(ython|erl) 5. ? 可选项 如: r'(http://)?(www\.)?python\.org' (http://和w

[ Python ] 正则表达式(1)

[ Python ] 正则表达式(1) 概念区分:搜索 ( Search ) 和 匹配 ( Match ) from re import search, match search("nana", "banana") # Search succeeds! search("bana", "banana") # Search succeeds! match("nana", "banana")

Python正则表达式指南

本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程. 注意:本文基于Python2.4完成:如果看到不明白的词汇请记得百度谷歌或维基,whatever. 尊重作者的劳动,转载请注明作者及原文地址 >.< [原文链接]http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表