Python实用技法第24篇:正则:查找和替换文本

1、需求

我们想对字符串中的文本做查找和替换。

2、解决方案

对于简单的文本模式,使用str.replace()即可。

例如:

text=‘mark ,帅哥,18,183 帅,mark‘
print(text.replace(‘18‘,‘19‘))
print(text)
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

运行结果:

mark ,帅哥,19,193 帅,mark
mark ,帅哥,18,183 帅,mark

针对更为复杂的模式,可以使用re模块中的sub()函数。

实例:将日期格式从“11/28/2018”改为“2018-11-28”

import re
text=‘今天是:11/28/2018‘
print(re.sub(r‘(\d+)/(\d+)/(\d+)‘,r‘\3-\1-\2‘,text))
print(text)

结果:

今天是:2018-11-28
今天是:11/28/2018

sub()的第一个参数是要匹配的模式,第二个参数是要替换的模式。类似的“3”这样的反斜线加数字表示模式中捕获组的编号。

如果打算用相同的模式执行重复替换,可以考虑先将模式编译以获得更好的性能。

实例:

import re
text=‘今天是:11/28/2018‘
datepat=re.compile(r‘(\d+)/(\d+)/(\d+)‘)
print(datepat.sub(r‘\3-\1-\2‘,text))
print(text)

结果:

今天是:2018-11-28
今天是:11/28/2018

对于更加复杂的情况,可以指定一个替换回调函数。

示例:

import re
from calendar import month_abbr
text=‘今天是:11/28/2018‘
datepat=re.compile(r‘(\d+)/(\d+)/(\d+)‘)

def change_date(m):
    mon_name=month_abbr[int(m.group(1))]
    return ‘{}  {}  {}‘.format(m.group(3),mon_name,m.group(2))
print(datepat.sub(change_date,text))
print(text)

结果:

今天是:2018 Nov 28
今天是:11/28/2018

替换回调函数的输入参数是一个匹配对象,由match()和find()返回。用.group()方法来提取匹配中特定的部分。该函数返回替换后的文本。

除了得到替换后的文本外,如果还想知道一共完成了多少次替换,可以使用re.subn()。

示例:

import re
text=‘今天是:11/28/2018,昨天是11/27/2018‘
datepat=re.compile(r‘(\d+)/(\d+)/(\d+)‘)
new_text,n=datepat.subn(r‘\3-\1-\2‘,text)
print(text)
print(new_text)
print(n)

结果:

今天是:11/28/2018,昨天是11/27/2018
今天是:2018-11-28,昨天是2018-11-27
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

3、分析

原文地址:https://blog.51cto.com/14445003/2429271

时间: 2024-10-24 12:22:56

Python实用技法第24篇:正则:查找和替换文本的相关文章

Python实用技法第6篇:让字典保持有序

1.需求 我们想创建一个字典,同时当对字典做迭代或序列化操作时,也能控制其中元素的顺序. 2.解决方案 要控制字典中元素的顺序,可以使用collections模块中的OrderedDict类.当对字典做迭代时,它会严格按照元素初始添加的顺序进行. from collections import OrderedDict d=OrderedDict() d['a']=1 d['b']=2 d['c']=3 d['d']=4 #根据插入删除输出 for key in d: print(key,d[ke

Python实用技法第22篇:利用Shell通配符做字符串匹配

1.需求 当工作在UNIX Shell下时,我们想使用常见的通配符模式(即:.py,Dat[0-9].csv等)来对文本做匹配. 2.解决方案 fnmatch模块提供了两个函数:fnmatch()和fnmatchcase(),可用来执行这样的匹配,使用起来非常简单. 实例: from fnmatch import fnmatch,fnmatchcase print(fnmatch('mark.txt','*.txt')) print(fnmatch('mark.txt','?ark.txt'))

Python实用技法第26篇:定义实现最短匹配的正则表达式

1.需求 我们正在尝试用正则表达式对文本模式做匹配,但识别出来的是最长的可能匹配.相反,我们想将其修改为最短的可能匹配. 2.解决方案 这个问题通常会在匹配的文本被一对开始和结束的分隔符包起来的时候出现(例如带引号的字符串),为了说明这个问题,请看下面实例: import re str_pat=re.compile(r'\"(.*)\"') text1='mark say "love"' text2='mark say "love",jingji

Python实用技法第31篇:文本过滤和清理

问题 某些无聊的脚本小子在Web页面表单中填入了"pyt???"这样的文本,我们想以某种方式将其清理掉. 解决方案 文本过滤和清理所涵盖的范围非常广泛,涉及文本解析和数据处理方面的问题.在非常简单的层次上,我们可能会用基本的字符串函数(例如str.upper()和str.lower())将文本转换为标准形式.简单的替换操作可通过str.replace()或re.sub()来完成,它们把重点放在移除或修改特定的字符序列上.也可以利用unicodedata.normalize()来规范化文

Python实用技法第32篇:对齐文本字符串

问题 我们需要以某种对齐方式将文本做格式化处理. 解决方案 对于基本的字符串对齐要求,可以使用字符串的ljust().rjust()和center()方法.示例如下: >>> text = 'Hello World' >>> text.ljust(20) 'Hello World ' >>> text.rjust(20) ' Hello World' >>> text.center(20) ' Hello World ' >&g

Python中如何查找和替换文本?

在Python开发中查找和替换非常简单,如果当前对象是一个字符串 str 时,你可以使用该类型提供的 find() 或者 index() 方法查找指定的字符,如果能找到则会返回字符第一次出现的索引,如果不存在则返回-1. >>> s = 'Cat and Dog'>>> s.find('Dog')8>>> s.index('Dog')8>>> s.find('Duck') -1 如果要替换目标字符串,用 replace() 方法就好了

【python cookbook】【字符串与文本】5.查找和替换文本

问题:对字符串中的文本做查找和替换 解决方案: 1.对于简单模式:str.replace(old, new[, max]) 2.复杂模式:使用re模块中的re.sub(匹配的模式, newstring, oldstring[,替换个数])函数 3.re.subn()可以获得替换的总次数 # example.py # # Examples of simple regular expression substitution import re #simple sample text1='yeah,b

在vs2013中使用正则表达式查找和替换文本内容

我们有的时候需要替换代码中的某些内容,因为替换的内容"不一致",所以不能简单的使用一个replace搞定.这里有几个解决方法,核心思想是一致的,程序员不要做体力活,能交给程序或脚本的就交给程序或脚本来完成. 我先提一个替换的需求,这个在实际工作中是很常见的.比如 把所有的toke[TOKEN_ENUM_ATTACK], token[TOKEN_ENUM_MAGIC]这样的字符串替换为TOKEN_ENUM_ATTACK, TOKEN_ENUM_MAGIC,也就是说去掉token[],直接

Mac上通过Linux命令行批量查找和替换文本

一般在本地电脑上批量替换文本有许多工具可以做到,比如Emeditor,sublime text ,但在linux和mac上相关的编辑器有这个功能的不多,另外大多服务器上都是无图形界面的,因此收集了几条针对linux命令行备忘,实现批量替换文本内容的命令: 批量查找某个目下文件的包含的内容 grep -rn "要找查找的文本" ./ 通过sed批量查找并替换文件内容. sed -i "s/要找查找的文本/替换后的文本/g"grep -rl "要找查找的文本&