【python】正则表达式中的转义问题

encode(‘string-escape‘) 解决

比如想匹配‘\x0e\x0a‘中的‘\x‘后的内容，这里希望把‘\x0e‘作为一个字符串，那么其中的\应该被转义。

未加转义的正则：

p = ‘(?<=\x)[0-9A-Za-z]{2}‘

直接这样写会报错，需要给\转义，于是变为

p = ‘(?<=\\x)[0-9A-Za-z]{2}‘

但由于使用的时候，会先将p的内容转义，然后匹配，所以又变成了\x和原始数据匹配，又会出错。解决：

p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘)

或者

p = ‘(?<=\\\\x)[0-9A-Za-z]{2}‘

测试代码：

import re

a = "\\x0e\\x0b\\x0c"
print a
p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘)
pattern = re.compile(p)
m = pattern.findall(a)
print m

输出：

\x0e\x0b\x0c
[‘0e‘, ‘0b‘, ‘0c‘]

时间： 2024-12-20 02:30:34

【python】正则表达式中的转义问题的相关文章

Python正则表达式中的re.S

title: Python正则表达式中的re.Sdate: 2014-12-21 09:55:54categories: [Python]tags: [正则表达式,python]--- 在Python的正则表达式中,有一个参数为re.S.它表示多行匹配.看如下代码: import re a = '''asdfsafhellopass: 234455 worldafdsf ''' b = re.findall('hello(.*?)world',a) c = re.findall('hello(.

python 正则表达式中反斜杠(\)的麻烦和陷阱

这里是一点小心得:由于下面两个原因,在正则表达式中使用反斜杠就会产生了一个双重转换的问题.(1).python自身处理字符串时,反斜杠是用于转义字符 (2).正则表达式也使用反斜杠来转义字符要匹配字符串中1个反斜杠应该怎么写正则表达式?"\\",这样行吗?试试就知道了,re模块抛异常了,因为在正则表达式中,"\\"就是一个反斜杠,对于正则表达式解析器来说,是一个转义字符,但是后面啥也没有,自然就报错了,"\\\"三个肯定是不行的,试试四

python 正则表达式中反斜杠(\)的麻烦和陷阱 （转）

正则表达式中的转义问题

正则表达式是javascript学习中非常重要的一部分,它的主要作用是验证表单. 说到正则表达式,我们首先想到的是它的创建方式,正则表达式创建的方式有两种:字面量形式和RegExp构造函数. 首先说字面量形式: 创建方法:var expression= / pattern / flags ; pattern(模式)部分可以是任何简单或复杂的正则表达式,可以包含字符类.限定符.分组.向前查找以及反向引用. flags(标志)部分表明正则表达式的行为.其中g表示全局模式,i表示不区分大小写模式,m表

Python正则表达式中的re.S的作用

在Python的正则表达式中,有一个参数为re.S.它表示"."(不包含外侧双引号,下同)的作用扩展到整个字符串,包括"\n".看如下代码: 1 import re 2 a = '''asdfhellopass: 3 worldaf 4 ''' 5 b = re.findall('hello(.*?)world',a) 6 c = re.findall('hello(.*?)world',a,re.S) 7 print 'b is ' , b 8 print 'c

Python字符串和正则表达式中的反斜杠('\')问题

在Python普通字符串中在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如 In [1]: print('abc\ndef') # '\n'具有换行的作用 abc defg In [2]: print('abc\tdef') # '\t'具有制位符的作用 abc defg 我们还可以用'\'来转义特殊字符,使其成为普通字符,比如 In [3]: print('abc\\tdef') # 使'\'成为一个普通的字符,没有转义作用 abc\tdef In [4]: prin

Python基础要点：字符串和正则表达式中的反斜杠(‘\‘)问题详解

给大家整理的是关于Python字符串和正则表达式中的反斜杠('\')问题以及相关知识点,有需要的朋友们可以学习下. 在Python普通字符串中在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如 1 In [1]: print('abc\ndef') # '\n'具有换行的作用 2 abc 3 defg 4 5 In [2]: print('abc\tdef') # '\t'具有制位符的作用 6 abc defg 我们还可以用'\'来转义特殊字符,使其成为普通字符,比如 1

正则表达式中pattern.match(),re.match(),pattern.search(),re.search()方法的使用和区别

正则表达式(regular expression)是一个特殊的字符序列,描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串. 将匹配的子串替换或者从某个串中取出符合某个条件的子串,或者是在指定的文章中抓取特定的字符串等.Python处理正则表达式的模块是re模块,它是Python语言中拥有全部的正则表达式功能的模块.正则表达式由一些普通字符和一些元字符组成.普通字符包括大小写的字母.数字和打印符号,而元字符是具有特殊含义正则表达式大致的匹配过程是: 拿正则表达式依次和字符串或者文本

python 正则表达式之转义字符

最近在整理python相关的知识,使用python对网站进行爬取数据的时候,需要使用到转义字符,之前对转义字符理解一直比较模糊,并且在python中还有一个叫原生字符r.所以通过网上调查资料对该内容进行整理,已备不时之需. 字符串转义反斜杠,在python中比较特殊,就是它可以用来构成一些特殊字符,比如"\n"表示换行,"\t"表示制表符. 其中的'\n'已转义为换行符,而'\W'没有发生转义,原因是"\W"在字符串转义中并不对应者特殊字符,没