python对字符串的处理是比较高效的,方法很多。maketrans和translate两个方法被应用的很多,但是具体怎么用常常想不起来。
让我们先回顾下这两个方法吧:
1.s.translate(table,str) 对字符串s移除str包含的字符,剩下的字符串按照table里的字符映射关系替换。table可以理解为转换表,比较‘a‘ -> ‘A‘, ‘b‘->‘B‘.
2.tabel = string.maketrans(‘s1‘, ‘s2‘) s1 和 s2 的长度必须一致,maketrans生成一个转换表,若在s中有s1,则替换为s2,这个转换表是字符字符一个个对应的,没必要全部包含
几个例子
1 import string 2 3 s = ‘helloworld, 0001111‘ 4 5 table = string.maketrans(‘‘,‘‘)#没有映射,保留原字符串 6 s.translate(table) #hello world, 0001111 7 s.translate(table, ‘hello000)‘#world, 1111 8 9 table = string.maketrans(‘abcdefgh‘,‘ABCDEFGH‘) 10 s.translate(table)#HEllo,worlD,0001111 11 s.translate(table,‘world‘)#HEllo,0001111
我们现在可以讲makerans,translate包装起来,形成一个返回闭包的工厂函数(print就是工厂函数)
1 import string 2 def translator(frm = ‘‘, to=‘‘, delete= ‘‘, keep = None): 3 if len(to) == 1: 4 to = to * len(frm) 5 trans = string.maketrans(frm, to) 6 if keep is not None: 7 allchars = string.maketrans(‘‘,‘‘) 8 delete = allchars.translate(allchars, keep.translate(allchars, delete)) 9 def translate(s): 10 return s.translate(trans, delete) 11 return translate
函数的最后用到了闭包,闭包是指有权访问另一个函数作用域中的变量的函数。创建闭包的常见方式,就是在一个函数内部创建另一个函数:
1 def make_adder(addend): 2 def adder(augend): return augend + addend 3 return adder
执行 p = make_addr(23)将产生内层函数addr的一个闭包,这个闭包在内部引用了名字addend,而addend又绑定到数值23,执行p(100)则最终返回123。
现在我们已经把各种可能性封闭在一个建议以用的接口后面。
>>>digits_only = translator(keep = string.digits)
>>>digits_only(‘Chris Perkins :224 -7992‘)
‘2247992‘
移除属于某字符集合的元素也非常简单:
>>>no_digits = translator(delete = string.digits)
>>>no_digits(‘Chris Perkins:224-7992‘)
‘Chris Perkings : - ‘
也可以替换:
>>>digits_to_hash = translator(from = string.digits, to = ‘#‘)
>>>digits_to_hash(‘Chris Perkins :224-7992‘)
‘Chris Perkins: ###-####‘
当delete和keep有重叠部分的时候,delete参数优先
>>>trans = translator(delete = ‘abcd‘, kepp =‘cdef‘)
>>>trans(‘abcdefg‘)
‘ef‘
其实可以更详细的添加一些异常来处理同时出现delete,keep的情况。