Python学习-37.Python中的正则表达式

作为一门现代语言，正则表达式是必不可缺的，在Python中，正则表达式位于re模块。

1 import re

这里不说正则表达式怎样去匹配，例如\d代表数字，^代表开头（也代表非，例如^a-z则不匹配任何小写字符），$代表结尾，这些百科或者其他书籍都有。

例子一，字符串中是否包含数字：

1 import re
2 userinput = input("please input test string:")
3 if re.match(r‘\d‘,userinput):
4     print(‘contain number‘)
5 else:
6     print(‘no number in input string‘)

假如输入的不包含数字的话，则re.match方法返回None，而含数字的话，则会返回一个Match对象。

例子二，分割字符串：

1 import re
2 userinput = input("please input test string:")
3 temp = re.split(r‘\s+‘,userinput)
4 print(temp)

\s代表任意空白字符（指空格、Tab等等的空白字符），+号表示1个或多个。那么这段代码的作用就是按照空白分割字符。例如字符串"a b dc"得到的将会是[‘a‘,‘b‘,‘dc‘]的列表。普通的字符串split函数要做到此功能则很难做到。

例子三，分组：

有时候，我们需要提取字符串中的一些部分，例如电话号码，由三位或四位的区号和八位的电话号码组成。

1 import re
2 userinput = input("please input test string:")
3 m = re.match(r‘(\d{3,4})-(\d{8})‘,userinput)
4 if m:
5     print(‘区号：‘ + m.group(1))
6     print(‘号码：‘ + m.group(2))
7 else:
8     print(‘格式错误‘)

分组使用()，这是正则表达式的基本。m.group从0开始计数，而0为输入的字符串。

例子四，贪婪匹配：

1 import re
2 userinput = input("please input test string:")
3 m = re.match(r‘^(\d+)(0*)$‘,userinput)
4 if m:
5     print(m.groups())
6 else:
7     print(‘格式错误‘)

输入102500，我们得到的是(‘102500‘,‘‘)。

而我们想要的结果是(‘1025‘,‘00‘)。这里就需要使用非贪婪匹配了。因为Python里正则表达式是默认使用贪婪模式的（C#中也是）。

修改代码如下：

1 import re
2 userinput = input("please input test string:")
3 m = re.match(r‘^(\d+?)(0*)$‘,userinput)
4 if m:
5     print(m.groups())
6 else:
7     print(‘格式错误‘)

即在\d+后加上一个?号。这样结果就会如我们所想的一样。

注意的是，非贪婪模式比贪婪模式效率要差，因此非到贪婪模式匹配不了就不要使用非贪婪模式。

例子五，正则表达式预编译：

使用re.compile方法。在多处需要使用到同一个正则表达式的时候，我们应该预编译该正则表达式，然后直接使用该方法返回的对象。

时间： 2024-12-27 15:32:05

Python学习-37.Python中的正则表达式的相关文章

python学习之web中的html

Web概述web起源web特点1.易导航和图形化界面2.与平台无关3.分布式结构4.动态性5.交互性 html 网页结构 HTML(Hyper Text Mark-up Language )即是超文本标记语言, 通过使用标记标签来描述页面文档结构和表现形式的一种语言,再由浏览器进行解析,然后把结果展示在网页上.?超文本指的是超链接?标记指的是标签1).HTML文件用编辑器打开显示的是文本,可以用文本的方式编辑.2). HTML文件用浏览器打开,浏览器会按照标签描述内容将文件渲染成网页,显示的网

总结：Python学习和 Python与C/C++交互

本篇仅仅是Python的学习和Python和C++数据对接过程中的一些总结. 由于工作的需要,用一周的时间学习 Python. Python是基于C实现的一门解释型语言,由于其易用性,俘获了不少开发者和运维的心.据说,Python 在科学计算领域,逐步吞噬着古老语言 Fortran的份额.这门语言是Google的第二语言,国内的知乎,豆瓣,都使用纯Python开发.Python的官方网站:http://www/python.org. 为了逐步完善的我们的数据库驱动服务,我们需要为客户提供更多,更

Python学习教程（Python学习路线+Python学习视频）：Python数据结构

Python学习教程(Python学习路线+Python学习视频):Python数据结构数据结构引言: 数据结构是组织数据的方式,以便能够更好的存储和获取数据.数据结构定义数据之间的关系和对这些数据的操作方式.数据结构屏蔽了数据存储和操作的细节,让程序员能更好的处理业务逻辑,同时拥有快速的数据存储和获取方式. 在这篇文章中,你将了解到多种数据结构以及这些数据结构在Python中实现的方式. 抽象数据类型和数据结构数据结构是抽象数据类型(ADT)的实现,通常,是通过编程语言提供的

Python学习-38.Python中的正则表达式（二）

在Python中,正则表达式还有较其他编程语言有特色的地方.那就是支持松散正则表达式了. 在某些情况,正则表达式会写得十分的长,这时候,维护就成问题了.而松散正则表达式就是解决这一问题的办法. 用上一次分组的代码作为例子: 1 import re 2 userinput = input("please input test string:") 3 m = re.match(r'(\d{3,4})-(\d{8})',userinput) 4 if m: 5 print('区号:' + m

Python学习【四】：正则表达式

一.正则表达式基础 1.简介正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大.得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同:但不用担心,不被支持的语法通常是不常用的部分.如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了. 正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一

Python基础教程：Python学习视频Python让你敲的代码不再是造轮子

你敲的代码是在造轮子?那就学Python呗!_Python基础教程 Bruce大神说" 人生苦短,我用Python ". 从公司角度而言: 国内基于Python创业成功的案例不在少数,豆瓣.知乎.果壳,全栈都是 Python,大家对Python自然有信心.并且从这几家公司出来的程序员与 CTO,创业的话一般都会选择Python. 从开发者个人角度而言: 计算机语言只是用来达成目的工具,?各种强大的第三方库,拿来就能用才是王道,让程序替代我们执行一些枯燥繁琐的工作.?至于句式是否优美.能

Python学习之--python概要

1 Python的优点 Python语言类库齐全,语法简洁,而且在linux上自带安装,在处理大数据以及自动化方面有其独有的特点.2 Python的解释器 Python解释器用来解释python代码,比较流行的python解释器有: CPython, 使用C解释器,将python源码解释为.pyc文件(字节码) JPython, 使用java解释器,将python源码解释为java识别的字节码 IronPython, 使用c#解释器解释为c#识别的字节码 PyPy,解释器解释为字

Python学习(一) Python安装配置

我本身是Java程序猿,听说Python很强大,所以准备学习一下Python,虽说语言都是相同的,但java跟python肯定还是有区别的.希望在此记录一下自己的学习过程. 目前,Python分2.X版本和3.X版本.我选择的是Python2.x版本.为了快速学习Python的WEB开发,我选择的Python的WEB开发框架是Django.Django有个好处就是自带了后台管理系统. 第一步,下载: 因本人使用的电脑操作系统是Windows7 64位,所以选择下载Python的windows安装

Python学习之Python简介

Python简介 Python的由来 Python(英国发音:/?pa?θ?n/ 美国发音:/?pa?θɑ?n/), 是一种面向对象.解释型计算机程序设计语言,它是吉多·范罗苏姆(Guide van Rossum)——龟叔在1989年12月时,想寻找一门“课余”编程项目来打发圣诞节前后的时间,决定为当时正构思的一个新的脚本语言写一个解释马戏团的狂热爱好者,他选择了Python作为项目的标题,使用C进行开发. 1991年发布Python第一个版本. Python是纯粹的自由软件, 源代码和解释器