python中re.findall()找到的结果替换

正则表达式re模块中用findall查找到的是ascii码，所以当比对替换时也需要对应的ascii码才能匹配成功。以下程序是查找文件夹下文件名中含有男、女的文件，并将男替换成1，将女替换成2的程序

# -*- coding: utf-8 -*-

import fnmatch
import os
import codecs
import re
import sys

def iterfindfiles(path, fnexp):
    for root, dirs, files in os.walk(path):
        for filename in fnmatch.filter(files, fnexp):
            yield os.path.join(root, filename)

def fiterFiles():

    path=raw_input("input dir:")
    filterfiletype=raw_input("input file filter type:")

    #quanjiao_2_banjiao(path)

    for filename in iterfindfiles(path,filterfiletype):
        SingerList=re.findall(‘\((..?)\)\.dat‘,filename)
        for SingerName in SingerList:
            if(SingerName==‘\xc4\xd0‘):
                SingerName=‘1‘
                new_filename=re.sub(‘\((..?)\)\.dat‘,‘(1).dat‘,filename)
                print new_filename
                os.rename(filename,new_filename)
                #print SingerName
            elif(SingerName==‘\xc5\xae‘):
                SingerName=‘2‘
                new_filename=re.sub(‘\((..?)\)\.dat‘,‘(2).dat‘,filename)
                print new_filename
                os.rename(filename,new_filename)

def main():
    fiterFiles()

if __name__ == "__main__":
    main()

时间： 2024-08-11 19:22:21

python中re.findall()找到的结果替换的相关文章

探寻Python中如何同时迭代多个iterable对象

题外话: 最近因为课程需要开始深入了解Python语言.因为以前一直用的Java.C++等强类型的静态语言,现在突然使用Python确实感受到了很大的不同. 直观感觉就是,在Python中总是能找到一些让代码变得精巧.简洁.高效.美观的写法,使得初学者在写代码的过程充满了惊喜,从而渐渐喜欢上Python.而且Python的官方手册阅读起来感觉非常好,很多问题都描述的很清楚.不过总体来说,还是觉得Java大法好:) Python中一个非常有用的语法就是for in循环跟iterable对象的结合,

Python中的re.search和re.findall之间的区别

参考博客:http://www.crifan.com/python_re_search_vs_re_findall/ 在这里,我想说一下我目前遇到的问题这是一个本地的文件 text.txt <html> <head> <title>极客学院爬虫测试</title> </head> <body> <div class="topic"><a href="http://jikexueyuan

Python中re(正则表达式)模块函数学习

今天学习了Python中有关正则表达式的知识.关于正则表达式的语法,不作过多解释,网上有许多学习的资料.这里主要介绍Python中常用的正则表达式处理函数. 方法/属性作用 match() 决定 RE 是否在字符串刚开始的位置匹配 search() 扫描字符串,找到这个 RE 匹配的位置 findall() 找到 RE 匹配的所有子串,并把它们作为一个列表返回 finditer() 找到 RE 匹配的所有子串,并把它们作为一个迭代器返回 match() 函数只检查 RE 是否在字符串开始处匹配

python 中正则表达式

. 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束代码/语法说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 [aeiou]就匹配任何一个英文元音字母,[.?!]匹配标点符号(.或?或!). [0-9]代表的含意与\d就是完全一致的:一位数字:同理[a-z0-9A-Z_]也完

Python中正则表达式（re模块）的使用

1.正则表达式的概述 (1)概述:正则表达式是一些由字符和特殊符号组成的字符串,他们描述了模式的重复或者表示多个字符,正则表达式能按照某种模式匹配一系列有相似特征的字符串.正则表达式是一种小型的.高度的专业化的编程语言, (2)Python语言中的正则表达式内嵌在Python中通过re模块实现,正则表达式被编译成一系列的字节码,然后由C编写的匹配引擎执行 2.字符匹配 (1)符号匹配符号描述示例实例说明 literal 匹配文本字符串的字面值literal root 匹配字符串root

python中常用的模块的总结

1. 模块和包 a.定义: 模块用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是.py结尾的python文件.(例如:文件名:test.py,对应的模块名:test) 包:用来从逻辑上组织模块的,本质就是一个目录(必须带有一个__init__.py的文件) b．导入方法 import module_name import module_1的本质:是将module_1解释了一遍也就是将module_1中的所有代码复制给了module_1 from module_n

第五章 python中正则表达式的使用

第一节正则表达式的一些介绍 1)掌握正则表达式的案例 2)写一个小爬虫 3)正则表达式(或RE)是一个小型的.高度专业化的编程语言,(在python中)它内嵌在python中,并通过re模块实现. - 可以为想要匹配的相应字符串集指定规则 - 该字符串集可能包含英文语句.e-mail地址.命令或任何你想搞定的东西 - 可以问诸如“这个字符串匹配该模式吗?” - “在这个字符串中是否有部分匹配该模式呢?” - 你也可以使用RE以各种方式来修改或分割字符串. 4)正则表达式模式被编译成一系列

Python中的正则表达式(re)

import re re.match #从开始位置开始匹配,如果开头没有则无 re.search #搜索整个字符串 re.findall #搜索整个字符串,返回一个list 举例: r(raw)用在pattern之前,表示单引号中的字符串为原生字符,不会进行任何转义 re.match(r'l','liuyan1').group() #返回l re.match(r'y','liuyan1') #返回None re.search(r'y','liuyan1').group() #返回y 正则表达式可

（数据科学学习手札32）Python中re模块的详细介绍

一.简介关于正则表达式,我在前一篇(数据科学学习手札31)中已经做了详细介绍,本篇将对Python中自带模块re的常用功能进行总结: re作为Python中专为正则表达式相关功能做出支持的模块,提供了一系列方法来完成几乎全部类型的文本信息的处理工作,下面一一介绍: 二.re.compile() 在前一篇文章中我们使用过这个方法,它通过编译正则表达式参数,来返回一个目标对象的匹配模式,进而提高了正则表达式的效率,主要参数如下: pattern:输入的欲编译正则表达式,需将正则表达式包裹在''内传