Python正则表达式就是这么简单【新手必学】

一前言
本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;

二 正则表达式的概念
正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作;

举个例子zszxz666 这个字符串,现在知识追寻者想要获得子串zszxz, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*,然后经过python正则表达式匹配函数就可以获得子串zszxz;这种方式比平时的字符串函数操作更加简便,适用范围广泛;
ps:另外很多人在学习Python的过程中,往往因为没有好的教程或者没人指导从而导致自己容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!

三 常用的正则匹配模式
常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;

模式 含义
^ 匹配字符串的开头
$ 匹配字符串的末尾
. 匹配任意字符,除了换行符
+ 匹配前面的子表达式一次或多次
? 匹配前面的子表达式零次或一次,或表示一个非贪婪限定符
* 匹配前面的子表达式零次或多次
\ 转义特殊字符
\d 匹配任意数字,等价于 [0-9]。
\D 匹配任意非数字
\s 匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]
\S 匹配任何非空白字符。等价[^\f\n\r\t\v]
\w 匹配数字字母下划线
\W 匹配非数字字母下划线
[…] 用来表示一组字符;[amk] 匹配 ‘a’,‘m’或’k’
[^…] 不匹配在[]中的字符;[^amk]不匹配 ‘a’,‘m’或’k’
{n} 匹配前面的子表达式n 次
{n,} 匹配前面的子表达式至少n 次
{n,m} 匹配前面的子表达式最少匹配 n 次且最多匹配 m 次
| 表示或;a| b,表示匹配a或者b
\b 匹配一个单词边界,即字与空格间的位置
\B 非单词边界匹配
四 python正则常用修斯符
re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解
五 python常用正则行数说明
pattern 表示正则表达式模式
string 表示传入待匹配字符串
flags 标志位,可以用第四节的修饰符限定
count 表示限定匹配的次数
repl 表示替换的字符串,也可为一个函数
pos 起始位置
endpos 结束位置
maxsplit 最大分割次数
函数名称 函数含义
re.findall(string, pos, endpos) 匹配所有子串,并返回一个列表,未匹配,则返回空列表
re.match(pattern, string, flags=0) 从字符串的起始位置匹配一个模式,如果匹配失败返回None
re.search(pattern, string, flags=0) 扫描整个字符串并返回第一个成功的匹配;匹配失败返回None
re.compile(pattern, flags=0) 编译正则表达式,生成一个正则表达式( Pattern )对象
re.sub(pattern, repl, string, count=0, flags=0) 查找和替换
re.finditer(pattern, string, flags=0) 与findall类似,返回的是迭代器
re.split(pattern, string, maxsplit=0, flags=0]) 将匹配的子串分割后返回列表
六 常用函数示例
6.1 match函数
group(num=0) 函数表示提取匹配的表达式,可以使用组号提取对应的匹配结果;知识追寻者想要获得字符串中第一个出现的数字串;

import re
# 指定模式 至少匹配一个数字
pattern = re.compile(r‘\d+‘)
# 输入的字符串
mat = pattern.match("451zszxz666")
# 获得第一个匹配到的值
g = mat.group();
# 451
print(g)
6.2search函数
知识追寻者想要获得指定的字符串,第一个匹配的就好;

import re
# 想匹配nhzszxz 或者 nh666 或者 nhnh
pattern = re.compile(r‘nh(zszxz|666|nh)‘)
ser = pattern.search(‘nhzszxzkkk nh666 llll nhnh‘)
g_0 = ser.group()
# zszxz
print(g_0)
g_1 = ser.group(1)
# nhzszxz
print(g_1)
6.3 findall函数
知识追寻者想要在字符串中获得所有的数字;

import re
pattern = re.compile(r‘\d+‘)
# 输入的字符串
mat = pattern.fidall("451zszxz666")
# [‘451‘, ‘666‘]
print(mat)
# 666
print(mat[1])
6.6 sub函数
知识追寻者想要获得所有非数字的子串;

import re
str = ‘8556gfggs5555dfg‘
# 替换所有数字
result = re.sub(r‘\d‘, ‘‘, str)
# gfggsdfg
print(result)
6.7 split函数
知识追寻者想要获得以,分割的字符串;

import re
str = ‘123,456,zszxz,666‘
result = re.split(‘,‘,str)
# [‘123‘, ‘456‘, ‘zszxz‘, ‘666‘]
print(result)
6.8 finditer 函数
知识追寻者想要获得数字451,和666;

import re
pattern = re.compile(r‘\d+‘)
# 输入的字符串
mat = pattern.finditer("451zszxz666")
for it in mat:
print(it.group())

七 初学者使用正则表达式正确的姿势
初学者在使用正则表达式的时候难免会得到的匹配的结果与自己预期的不符合,可以借助一些在线工具匹配完成后再进行代码编写,常用的在线正则匹配测试如下;

在线工具
站长工具

-----以上就是本次分享:另外很多人在学习Python的过程中,往往因为没有好的教程或者没人指导从而导致自己容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!
本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

原文地址:https://www.cnblogs.com/chengxuyuanaa/p/12245132.html

时间: 2024-07-29 00:07:20

Python正则表达式就是这么简单【新手必学】的相关文章

Python自定义包引入【新手必学】

前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:sys_song python中的Module是比较重要的概念.常见的情况是,事先写好一个.py文 件,在另一个文件中需要import时,将事先写好的.py文件拷贝 到当前目录,或者是在sys.path中增加事先写好的.py文件所在的目录,然后import.这样的做法,对于少数文件是可行的,但如果程序数目很 多,层级很复杂,就很吃力了.如果你刚学python不久,有问题

Python类和实例【新手必学】

面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同. 仍以Student类为例,在Python中,定义类是通过class关键字:ps注意:很多人学Python过程中会遇到各种烦恼问题,没有人帮答疑容易放弃.为此小编建了个Python全栈免费答疑.裙 :七衣衣九起起巴而五(数字的谐音)转换下可以找到了,不懂的问题有老司机解决里面还有最新Pyth

新手必学 手机录屏软件具体操作过程

很多新手宝宝们在下载了一款新的录屏大师软件之后去不知道该如何使用,或者觉得有些软件的操作程度太深,自己无从下手,面对这一问题,关于手机录屏软件具体操作过程,今天小编就来和你们一一说来,如果有感兴趣的宝宝可以一起往下看了. 录屏大师http://www.xunjieshipin.com/download-airscreen 安卓录屏软件http://www.pc6.com/softview/SoftView_600540.html 软件介绍: 迅捷录屏大师APP是一款适用于安卓手机的软件,它可以录

用Python实现简单的服务器【新手必学】

如何实现服务器... socket接口是实际上是操作系统提供的系统调用.socket的使用并不局限于Python语言,你可以用C或者JAVA来写出同样的socket服务器,而所有语言使用socket的方式都类似(Apache就是使用C实现的服务器) Web框架就是提前写好了服务器.不能跨语言的使用框架.框架的好处在于帮你处理了一些细节,从而实现快速开发,但同时受到Python本身性能的限制.我们已经看到,许多成功的网站都是利用动态语言(比如Python, Ruby或者PHP,比如twitter和

Python整合pdf【新手必学】

在下载课件时往往会分成很多个小的pdf,一个也就几页,想要整合成一整个大pdf,于是百度了一下,网上有很多在线的pdf整合器,但是由于这蛋疼的网速,流量还要花钱,还是想要本地搞. 说python是万能的,于是上pypi一搜,果然满满的全是.比如这个PyPDF2,另外如果你刚学python不久,问题多,可以去小编的Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦! 简单看了一下文档,结构十分简单,最

Python爬虫之cookie的获取、保存和使用【新手必学】

前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:huhanghao Cookie,指某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据(通常经过加密). 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容,登陆前与登陆后是不同的,或者不允许的.另外如果你刚学不久.对这方面还不熟,建议先去小编的Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里

Python实现一个桌面版的翻译工具【新手必学】

Python 用了好长一段时间了,起初是基于对爬虫的兴趣而接触到的.随着不断的深入,慢慢的转了其它语言,毕竟工作机会真的太少了.很多技能长时间不去用,就会出现遗忘,也就有了整理一下,供初学者学习和讨论.相对于其它语言,你可以用很少的代码,便能实现一个完整的功能. ps:另外很多人在学习Python的过程中,往往因为遇问题解决不了从而导致自己放弃,为此我建了个Python全栈开发交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题有老司机解决

Python 分发包中添加额外文件【新手必学】

在制作一个 Python 分发包时经常需要把一些文件添加到包中.最常见的例子是你希望通过 pip install命令安装 Python 包时会在 /etc/ 等目录下自动添加默认配置文件,由此可以让 Python,PS:另外也有很多人在学习Python的过程中,往往因为遇问题解决不了或者没好的教程从而导致自己放弃,为此我整理啦从基础的python脚本到web开发.爬虫.django.数据挖掘等[PDF等]需要的可以进Python全栈开发交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了

Python编码小技巧分享【新手必学】

本次分享了python编程小技巧总结如下,希望对大家有帮助,非常实用哦注意:很多人学Python过程中会遇到各种烦恼问题,没有人帮答疑.为此小编建了个Python全栈免费答疑交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,不懂的问题有老司机解决里面还有最新Python教程项目可拿,,一起相互监督共同进步! 交换值 从列表中的所有元素创建单个字符串 查询列表中出现频率最多的元素 检查两个单词是否是字谜 反转字符串 反转列表 转置 2 维数组 链式比较 链式函数调用 列表复制 字典值获