【python cookbook】【字符串与文本】7.定义实现最短匹配的正则表达式

问题:使用正则表达式对文本模式匹配,将识别出来的最长的可能匹配修改为找出最短的可能匹配

解决方法:在匹配模式中的*操作符后加上?修饰符

import re

# Sample text
text = ‘Computer says "no." Phone says "yes."‘

# (a) Regex that finds quoted strings - longest match
str_pat = re.compile(r‘\"(.*)\"‘)
print(str_pat.findall(text))

# (b) Regex that finds quoted strings - shortest match
str_pat = re.compile(r‘\"(.*?)\"‘)
print(str_pat.findall(text))
>>> ================================ RESTART ================================
>>>
[‘no." Phone says "yes.‘]
[‘no.‘, ‘yes.‘]
>>> 

(a)例子中被错误的匹配成2个被引号包围的字符串

补充:本节提到了一个当编写含有句点(.)字符的正则表达式时会遇到的问题。

在模式匹配中,句点除了换行符之外可匹配任意字符。

时间: 2024-08-03 06:27:20

【python cookbook】【字符串与文本】7.定义实现最短匹配的正则表达式的相关文章

python cookbook 字符串和文本

使用多个界定符分隔字符串 import re line = 'asdf fjdk; afed, fjek,asdf, foo' print(re.split(r'[;,\s]\s*', line)) print(re.split(r'(;|,|\s)\s*', line)) #加括号表示捕获分组,这样匹配的结果也显示在列表中 匹配开头或结尾 url = 'http://www.python.org' print(url.startswith(('http', 'https', 'ftp')))

Python实用技法第26篇:定义实现最短匹配的正则表达式

1.需求 我们正在尝试用正则表达式对文本模式做匹配,但识别出来的是最长的可能匹配.相反,我们想将其修改为最短的可能匹配. 2.解决方案 这个问题通常会在匹配的文本被一对开始和结束的分隔符包起来的时候出现(例如带引号的字符串),为了说明这个问题,请看下面实例: import re str_pat=re.compile(r'\"(.*)\"') text1='mark say "love"' text2='mark say "love",jingji

Python Cookbook(第3版)中文版pdf

下载地址:网盘下载 内容简介  · · · · · · <Python Cookbook(第3版)中文版>介绍了Python应用在各个领域中的一些使用技巧和方法,其主题涵盖了数据结构和算法,字符串和文本,数字.日期和时间,迭代器和生成器,文件和I/O,数据编码与处理,函数,类与对象,元编程,模块和包,网络和Web编程,并发,实用脚本和系统管理,测试.调试以及异常,C语言扩展等. 本书覆盖了Python应用中的很多常见问题,并提出了通用的解决方案.书中包含了大量实用的编程技巧和示例代码,并在Py

python书籍推荐:Python Cookbook第三版中文

所属网站分类: 资源下载 > python电子书 作者:熊猫烧香 链接:http://www.pythonheidong.com/blog/article/44/ 来源:python黑洞网 内容简介 <Python Cookbook(第3版)中文版>介绍了Python应用在各个领域中的一些使用技巧和方法,其主题涵盖了数据结构和算法,字符串和文本,数字.日期和时间,迭代器和生成器,文件和I/O,数据编码与处理,函数,类与对象,元编程,模块和包,网络和Web编程,并发,实用脚本和系统管理,测

【python cookbook】【字符串与文本】4.文本模式的匹配和查找

问题:按照特定的文本模式进行匹配或查找 解决方法: 1.简单的文字匹配,只需使用str.find().str.startswith().str.endswith()或类似的函数即可: 2.复杂的匹配,需要使用正则表达式以及re模块 >>> import re >>> text1='11/23/2016' >>> text2='Nov 23,2016' >>> if re.match(r'\d+/\d+/\d+',text1): pri

一个新手的Python自学之旅 #MacBook #《“笨办法”学Python》#第七章:字符串、文本、各种打印、转义序列、手动输入raw_input()

第七章预告:字符串.文本.各种打印.转义序列.手动输入raw_input() ------------------------------------<习题6:字符串和文本>--------------------------------------- 在这里还时有必要详细介绍一下字符串以及和格式化字符之间的应用: 字符串:通常是指需要展示给别人的或者是想要从程序里“导出”的一小段字符,吧啦吧啦吧啦吧啦,是不是觉得挺拗口的,不如举个例子来的实在. 在ex1.py的这段代码print "

《Python cookbook》 “定义一个属性可由用户修改的装饰器” 笔记

看<Python cookbook>的时候,第9.5部分,"定义一个属性可由用户修改的装饰器",有个装饰器理解起来花了一些时间,做个笔记免得二刷这本书的时候忘了 完整代码:https://github.com/blackmatrix7/python-learning/blob/master/python_cookbook/chapter_9/section_5/attach_wrapper.py 书中的装饰器(书中称之为访问器函数) def attach_wrapper(o

《Python CookBook2》 第一章 文本 - 过滤字符串中不属于指定集合的字符 &amp;&amp; 检查一个字符串是文本还是二进制

过滤字符串中不属于指定集合的字符 任务: 给定一个需要保留的字符串的集合,构建一个过滤函数,并可将其应用于任何字符串s,函数返回一个s的拷贝,该拷贝只包含指定字符集合中的元素. 解决方案: import string allchars = string.maketrans('','') #all chars table def makefilter(keep): delchars = allchars.translate(allchars,keep) def thefilter(s): retu

13、如何拆分含有多种分隔符的字符串 14、如何判断字符串a是否以字符串b开头或结尾 15、如何调整字符串中文本的格式 16、如何将多个小字符串拼接成一个大的字符串

13.如何拆分含有多种分隔符的字符串 import re s = "23:41:2314\1234#sdf\23;" print(re.split(r'[#:\;]+',s))  14.如何判断字符串a是否以字符串b开头或结尾 import os,stat #找到当前目录下的文件名称,返回list ret = os.listdir('.') print(ret) for x in ret: #endswith传参类型是tuple if x.endswith(('.py','.html'