一、正则表达式简介
就其本质而言,正则表达式(或RE)是一种小型的、高度专业化的(在python中),它内嵌在python中,并通过RE模块实现。正则表达式编译成一系列字节码,然后由用C编写的匹配引擎执行。
二、字符匹配(普通字符、元字符)
普通字符:大多数字符和字母都会和自身匹配
#!usr/bin/env python # -*- coding:utf-8 -*- import re li = re.findall(‘alex‘,‘faljfaljflajalexaa‘) print(li) #打印输出[‘alex‘]
元字符的作用:
. ----代表除了换行符以外的其他任何字符
^ ----代表以后面的字符开始
$ ----代表以前面的字符结束
[] -----字符集,[a-z]代表小写字母从a到z的任何一个字母,[0-9]代表0-9的任何一个数字,[.]代表字符.,[a9]代表a或9,[^a-z]代表除了a-z的其他任何字符
代表数量的元字符:
* -----代表任意个字符,0-多个字符
+ -----代表1-多个字符
? ------代表0-1个字符
{} ------代表重复固定次数,如:{3}重复3次,{3,}大于等于3次,{3,5}重复3-5次,{,3}重复0-3次
时间: 2024-10-15 14:10:12