Python 基础之re 模块

Python 基础之大话 re

在使用re模块中主要会用到一下几个方法:

re.match()
#从头匹配一个字符串
re.search()
#浏览全部字符串,匹配第一个符合规则的字符串
re.findall()
#将匹配到的所有内容都放在一个列表中
#re.finditer()
re.split()
re.sub()

好,先简单的介绍一下re 模块中的基础知识:

1.元字符 . ^ $ * + ? {} []  | () \  ,

2.\的功能:

        #1.反斜杠后面跟元字符去除特殊功能
        #2.反斜杠后面跟普通字符实现特殊功能
        #3.引用序号对应的字组所匹配的字符串

有了上面的基本概念就可以写几个例子来说明一下问题了:

a=‘abcd‘.find(‘b‘)
b=‘abcd‘.split(‘b‘)
c=‘abcd‘.replace(‘ab‘,‘er‘)
d=re.findall(‘alex.w‘,‘aaaalexcw‘)#.为通配符,一个点只能表示一个字符.表示除去换行符以外任意一个字符
e=re.findall(‘^alex‘,‘alexaaalexcw‘)#^尖角符是用来控制开头的,而$是用来控制结尾的
f =re.findall(‘alex*‘,‘aaaalecw‘)#*为控制*符号前面的字符重复0~多次
g =re.findall(‘alex+‘,‘aaaalexxxxcw‘)#+为控制+符号前面的字符重复1~多次
h=re.findall(‘alex?‘,‘aaaalexcw‘)#?为控制?符号前面的字符重复0~1次
i = re.findall(‘alex{3,5}‘,‘aaaalexxxxxxxcw‘)#{}为控制{}符号前面的字符重复括号输入的次
g = re.findall(‘a[bc]d‘,‘aaaacdsssssacdvvdabcdf‘)
#[]表示的是字符集的意思字符集中的元素的关系是“或”的意思
#在字符集中[1-9]表示取1到9这几个数字都是可以的,[a-z]表示取a到z这些字母都是OK的
#[^xx]尖角^在字符集中的含义是取字符集中元素的“非”

接下来对上面的常用方法进行举例:

match方法中的有分组与无分组
#1.无分组
prigin = ‘hello alex bcd alxe leg alex acd age19‘
r = re.match(‘h\w+‘,prigin)
print(r.group()) #获取匹配到的所有结果
print(r.groups()) #获取模型中匹配到的分组结果
print(r.groupdict()) #获取模型中匹配到的分组结果

#2.有分组
#目的是提取匹配成功的指定内容(先匹配成功全部正则,再匹配成功的局部内容提取出来)
prigin = ‘hello alex bcd alxe leg alex acd age19‘
r = re.match(‘(h)\w+‘,prigin)
print(r.group()) #获取匹配到的所有结果,加括号后有无分组没有任何影响
print(r.groups()) #获取模型中匹配到的分组结果,加括号后会把加括号的内容提取出来
print(r.groupdict()) #获取模型中匹配到的分组结果
#在grouopdict()中需要一个键与值与之对应才可使用,在写法上如下例子所示
prigin = ‘hello alex bcd alxe leg alex acd age19‘
r = re.match(‘(?P<n1>h)(?P<n2>\w+)‘,prigin)
print(r.group()) #获取匹配到的所有结果,加括号后有无分组没有任何影响
print(r.groups()) #获取模型中匹配到的分组结果,加括号后会把加括号的内容提取出来
print(r.groupdict()) #获取模型中匹配到的分组结果

#search方法中的有分组与无分组
#1.无分组

prigin = ‘hello alex bcd alxe leg alex acd age19‘
r = re.search(‘a\w+‘,prigin)
print(r.group()) #获取匹配到的所有结果
print(r.groups()) #获取模型中匹配到的分组结果
print(r.groupdict()) #获取模型中匹配到的分组结果

#2.有分组
prigin = ‘hello alex bcd alxe leg alex acd age19‘
r = re.search(‘a(\w+).*(?P<name>\d)$‘,prigin)
print(r.group()) #获取匹配到的所有结果
print(r.groups()) #获取模型中匹配到的分组结果
print(r.groupdict()) #获取模型中匹配到的分组结果

‘‘‘

‘‘‘
#findall基本方法,做的都是groups()的东西
#1.寻找时是按照一个字符,一个字符的寻找,当找到符合要求的之后(相当于把符合要求的拿走),再从下一个字符开始寻找
r1 = re.findall(‘\d+\w\d+‘,‘a2b3c4d5‘)
print(r1)

#2.空的内容也可以匹配
r2 = re.findall(‘‘,‘a2b3c4d5‘)
print(r2)

#findall方法中的有分组与无分组

prigin = ‘hello alex bcd alxe leg alex acd age 19‘
r1 = re.findall(‘a\w+‘,prigin)
print(r1)
r2 = re.findall(‘(a\w+)‘,prigin)
print(r2)
r3 = re.findall(‘a(\w+)‘,prigin)
print(r3)
r4 = re.findall(‘(a)(\w+)‘,prigin)
print(r4)
r5 = re.findall(‘(a)(\w+(e))(x)‘,prigin)#从左到右,从外到内
print(r5)
#finditer 迭代过程可以加入的内容
prigin = ‘hello alex bcd alxe leg alex acd age 19‘
r6 = re.finditer(‘(a)(\w+(e))(?P<n1>x)‘,prigin)#从左到右,从外到内
print(r6)
for i in r6:
    print(i,i.group(),i.groups(),i.groupdict())

a = ‘alex‘
n = re.findall(‘(\w)(\w)(\w)(\w)‘,a)
print(n)
n = re.findall(‘(\w){4}‘,a)
print(n)
n = re.findall(‘(\w)*‘,a)#*代表有0~很多个,则当为0个时就会出现控格来补充
print(n)
n = re.findall(‘‘,a)
print(n)

‘‘‘
‘‘‘
#re.split方法的讲解(分割的目的)
origin = ‘hello alex bcd alxe leg alex acd age 19‘
origin.split(‘a‘)
print(origin.split(‘a‘))#在字符串中分隔符的用法
#无分组
n = re.split(‘a\w+‘,origin,1)#第三个参数的意思是从头开始只分割一次,且此方法不保留分割的字符
#有分组
n1 = re.split(‘(a\w+)‘,origin)#在分割的字符上加上括号表示的是不仅需要按此字符分割而且还需要保留此字符
n2 = re.split(‘a(\w+)‘,origin)
print(n1 , n2)
‘‘‘

‘‘‘
#re.sub 是用来做替换用的

origin = ‘1jhjhjhj2hjhjhjk4hjhjhjkh5jkhjhjk6hkjk‘
n1 = re.sub(‘\d+‘,‘DDD‘,origin,1)
n2 = re.sub(‘\d+‘,‘DDD‘,origin)
n3,count = re.subn(‘\d+‘,‘DDD‘,origin)
print(n1)
print(n2)
print(n3,count)
时间: 2024-12-17 00:35:27

Python 基础之re 模块的相关文章

python基础31[常用模块介绍]

python基础31[常用模块介绍] python除了关键字(keywords)和内置的类型和函数(builtins),更多的功能是通过libraries(即modules)来提供的. 常用的libraries(modules)如下: 1)python运行时服务 * copy: copy模块提供了对复合(compound)对象(list,tuple,dict,custom class)进行浅拷贝和深拷贝的功能. * pickle: pickle模块被用来序列化python的对象到bytes流,从

python基础,导入模块,if语句,while语句

python基础 python代码 变为字节码 变为机器码 最后执行执行'文件名.py'文件时出现的'文件名.pyc'文件为字节码 缓存机制 使用pycharm的时候在文件最开始添加下面这两行代码,中文部分为解释#!/user/bin/env python 用执行下面的命令#-*- coding:utf-8 -*- 使用的编码为UTF-8 为了不每次编写文件的时候都需要添加这两行代码,我们可以在pycharm中设置py文件的基础代码,就是创建py文件就会生成的代码 链接 import lib #

Python基础5-常用模块

本节大纲 模块介绍 time &datetime模块 random os sys shutil shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式 模块,就是实现某种或者某类功能代码的合集. 类似于函数式编程和面向过程编程,函数式编程完成一个功能,其他代码可以调用,提供了代码的重用性跟代码间的耦合.对于一个复杂的功能,可能需要多个函数才能完成,多个.py文件的代码集合就叫做模块. 如:os是系统相关的模块:f

2015/9/15 Python基础(12):模块和包

模块是用来组织 Python 代码的方法,而包则是用来组织模块的. 当代码量很大时,我们一般会把代码分成几个有组织的代码段,然后每个代码段之间有一定的联系.代码单之间是共享的,所以Python允许调入一个模块,允许使用其他模块的属性利用之前的工作成果,实现代码重用.那些自我包含并且有组织的代码片段就是模块(module),将其他模块中属性附加到你的模块中的操作较导入(import) 模块是逻辑上的说法,而它们在物理层是一个个独立的文件,模块的文件名就是模块的名字加拓展名.py.与其他可以导入类的

[Python基础]009.os模块(1)

os模块(1) 介绍 os 常量 文件目录操作 文件属性操作 遍历文件夹 介绍 os模块是系统服务应用程序接口,是Python最常用的模块之一. os模块包含了对文件和文件夹的操作,操作系统相关的操作等. 以及os.path模块,主要处理路径操作. os 常量 os.linesep 换行符,Unix为 \n ,Win32为 \r\n os.sep 文件路径分隔符,Unix为 /,Win32为 \ os.pathsep 多个文件路径间的分隔符,Unix为 :,Win32为 ; os.curdir

Day5 - Python基础5 常用模块学习

Python 之路 Day5 - 常用模块学习 本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式 模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,

python基础11 ---函数模块1

函数模块 一.函数模块的作用(为什么要有函数模块) 1.函数模块可以减少代码量 2.函数模块方便阅读 3.函数模块维护性强二.函数模块的本质以及调用方法 1.函数模块的本质就是一个.py结尾的文件,该文件内写入大量函数 2.必须用import来引用函数模块,在调用函数模块时必须以"模块名.函数名"来调用函数模块中的函数. 3.有的时候我们只需要用到模块中的某个函数,也可以用"from 模块名 improt 函数1,函数2"的方式来引用该模块,但只是一次引用,不建议使

python基础14 ---函数模块5(模块和包)

模块与包 一.模块 1.模块是怎么诞生的. 在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护.为了编写可维护的代码,我们把很多函数分组,分别放到 不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式.在Python中,一个.py文件就称之为一个模块(Module). 2.模块的作用. 提高了代码的可维护性.其次是编写代码不必从零开始.当一个模块编写完毕,就可以被其他地方引用.我们在编写程序的时候,也经常引用其他模块,

python基础五:模块

模块&包 模块(Module)的概念:在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里的代码会越来越长,维护也越来越不易.为了编写可维护的代码,我们把很多函数分组,分别放在不同的文件里,很多语言都采用这个组织代码的方式,在python中一个.py文件就称之为模块.使用模块的好处:大大提高代码的可维护性.其次,编写代码不必从零开始.当一个模块编写完毕,就可以被其他地方引用.我们在编写程序的时候,也经常引用其他模块,包括Python内置的模块和来自第三方的模块. 所以,模块一共三种: p