有时候会碰到一些错误换行的数据,比如正确数据应该是:
20141010,aaa,bbb,ccc,ddd,eee
但是实际给过来的数据是:
20141010,aaa,bbb, ccc,ddd, eee
这样出现错误换行,在进行一些数据处理时就不能通过
解决办法:
import re dfile=open(‘tt.txt‘,‘r‘) lists=[] for line in dfile: m=re.match(‘2014.+‘,line) if m: lists.append(line) else: lists[-1]=lists[-1].strip(‘\n‘)+line print lists ofile=open(‘ttt.txt‘,‘w‘) for line in lists: ofile.write(line) dfile.close() ofile.close()
用正则表达式匹配行开头,去掉换行符
时间: 2024-12-27 04:16:03