python3下re模块的使用

**explain:**python3中的re库是一个正则匹配的函数库,里面包含了各种功能的正则函数,下面,我们一起学习下其中的几个常用函数

* **match()方法**:

从主串的起始位置开始匹配一个子串,匹配成功,返回匹配信息,不成功则返回NONE

print(re.match("www", "www.baidu.com"))

下面是返回的信息内容,包括子串的内容和子串在主串中的起始位置

<re.Match object; span=(0, 3), match=‘www‘>

* **search()方法**:

从整个主串中匹配子串,与search方法相比,match方法更适合检查某个字符串的开头是否符合某个规定
        
        print(re.search("com", "wwww.baidu.com"))

下面是返回的信息内容,与match方法一样,但如果我们在这里使用match方法则会返回NONE,因为主串的开头不是‘com’

<re.Match object; span=(11, 14), match=‘com‘>

* **span()方法**:

只返回子串在主串中的起始位置,在match和search方法中都可使用

print(re.match(‘www‘, ‘www.baidu.com‘).span())

下面是返回信息,是元组类型
        
        (0, 3)

* **group()方法**:
    
    与span方法类似,返回的是匹配的内容。

print(re.search("com", "www.baidu.com").group())

下面是返回信息
        
        com

下面是一个运营group方法的栗子。

line = "Cats are smarter than dogs"
        matchObj = re.match(r‘(.*) are (.*?) .*‘, line, re.M | re.I)

if matchObj:
            print("matchObj.group() : ", matchObj.group())#.group()方法返回匹配成功的字符串
            print("matchObj.group(1) : ", matchObj.group(1))#返回第一个匹配的子分组,即为(.*)
            print("matchObj.group(2) : ", matchObj.group(2))#返回第二个匹配的子分组,即为(.*?)
        else:
            print("No match!!")

下面是运行结果:

matchObj.group() :  Cats are smarter than dogs
        matchObj.group(1) :  Cats
        matchObj.group(2) :  smarter

* **findall()方法:**

以列表的形式返回主串中所有符合规则的的子串
        
        s = ‘s5s45ad465a5da‘
        m = r‘\d+‘
        n = re.findall(m, s)
        print(n)

下面是运行结果:
        [‘5‘, ‘45‘, ‘465‘, ‘5‘],符合规则的相邻字符被作为一个元素存到数组里。

* **finditer()方法:**

finditer找到匹配的所有的子串,并把它作为迭代器返回

s = ‘12 drumm44ers drumming, 11 ... 10 ...‘
        iter = re.finditer(r‘\d+‘, s)
        for i in iter:
            print(i)
            print(i.group())
            print(i.span())

###上面就是一些re库中常用的正则函数,下面给大家分享两个网址,第一个是教你如何看懂复杂的正则表达式,第二个是一位大佬写的更加详细的python正则

教你看懂复杂的正则:[https://www.cnblogs.com/superstar/p/6638970.html](https://www.cnblogs.com/superstar/p/6638970.html)

详解python正则:[https://www.cnblogs.com/tina-python/p/5508402.html](https://www.cnblogs.com/tina-python/p/5508402.html)

原文地址:https://www.cnblogs.com/liangxiyang/p/10874095.html

时间: 2024-10-12 19:50:43

python3下re模块的使用的相关文章

python3下tomorow模块报语法错误def async(n, base_type, timeout=None): ^ SyntaxError: invalid syntax

python3 pip 安装tomorrow模块,调用时候会报错:def async(n, base_type, timeout=None): ^ SyntaxError: invalid syntax 查看motorrow.py源码发现,async是python的关键字,换个换个函数名,如async_th 原文地址:https://www.cnblogs.com/xioawu-blog/p/11496634.html

python3 不同目录下的模块调用

我们新手在写python的时候往往会调用其他目录下的模块来干活(老鸟都知道的),有时会不知道怎么办, 如我们在目录B下的脚本d.py需要调用目录A下的脚本c.py这时该怎么做呢 ? 我们需要用到模块os和sys来把A目录加到环境变量中去就行了: 在脚本d.py import sys,os BASE_PATH=os.path.dirname(os.path.dirname(os.path.abspath(__file__))) sys.path.append(BASE_PATH) from mod

Python3 内建模块 hashlib、itertools、HTMLParser、urllib

Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等. 什么是摘要算法呢?摘要算法又称哈希算法.散列算法.它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示). 举个例子,你写了一篇文章,内容是一个字符串'how to use python hashlib - by Michael',并附上这篇文章的摘要是'2d73d4f15c0db7f5ecb321b6a65e5d6d'.如果有人篡改了你的文章,并发表为'how to use pytho

Python3 内建模块 datetime/collections/base64/struct

datetime 我们先看如何获取当前日期和时间: >>> from datetime import datetime >>> now = datetime.now() # 获取当前datetime >>> print(now) 2015-05-18 16:28:07.198690 >>> print(type(now)) <class 'datetime.datetime'> 注意到datetime是模块,datetim

Python3下开启科学计算模式

Python(x,y)是一款很好的Python2科学计算的集成开发环境 但是Spyder,IPython感觉用起来总没有Winge 101来得流畅 而且Python3的出现,众多模块也具备了3的相对应版本 之前在Python3下开启pylab画图等模式时,总会出现许多问题 所以,总结了一下 import numpy as npimport scipy as spimport matplotlib as mplimport matplotlib.pyplot as pltfrom pylab im

python在windows下安装模块错误

我的环境是win7+vs2013+python3.2,都是32位 windows下安装模块错误 1)Unable to find vcvarsall.bat : 打开"<python安装目录>\Lib\distutils\msvc9compiler.py" 找到 toolskey = "VS%0.f0COMNTOOLS" % version, 直接修改为 toolskey = "VS100COMNTOOLS"  (如果是vs2012或

在python3下使用peewee

在python3下使用peewee-2.1.4做ORM.连接MySQL数据库,提示需要MySQLdb模块,发现MySQLdb模块不支持python3,各种折腾.google不得其法. 然后又试着使用MySQL官方forPython驱动 Connector/Python需要对qeewee代码改动改动的渐入佳境,沾沾自喜中发现peewee的代码中有如下片段 try:import MySQLdb as mysqlexcept ImportError:try:import pymysql as mysq

python3下django连接mysql数据库

1.安装pymysql pip install pymysql 有一点需要注意,有的系统(比如ubuntu16.04)同时安装了python2和python3,而比较新的django需要在python3下运行,所以在安装pymysql时可能要使用命令 pip3 install pymysql 进行安装. 2.修改项目settings.py 找到并修改DATABASES为如下形式: DATABASES = { 'default': { 'ENGINE': 'django.db.backends.m

python3.7 os模块

#!/usr/bin/env python __author__ = "lrtao2010" #python3.7 os模块 #os模块是与操作系统交互的一个接口 # os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 # os.chdir("dirname") 改变当前脚本工作目录:相当于shell下cd # os.curdir 返回当前目录: ('.') # os.pardir 获取当前目录的父目录字符串名:('..') # os.m