python自定义方法处理日志文件

从命令行界面拷贝的内容包含过个">>>"，函数的作用是用正则把每两个">>>"之间的字符取出来，然后把包含“Traceback...”的字符的内容去掉，再写到另一个文件中

代码：

#coding=utf-8
import re
import os
def clearContent(fileName):
    result=[]
    with open(fileName) as fp:
        content=fp.read()
    L=re.findall( r‘(?<=>>>).+?(?=>>>)‘ , content,re.M|re.DOTALL)
    print "len(L):",len(L)
    for i in L:
        if "Traceback" not in i:
            result.append(i)
    print "len(result):",len(result)
    with open("%s_new1.txt"%os.path.splitext(fileName)[0],"w") as fp1:
        for i in result:
            fp1.write(i)
    print "Done!\n please find the new file: %s_new1.txt"%os.path.splitext(fileName)[0]
    return ""

clearContent("d:\\re.txt")

结果：

原文地址：https://www.cnblogs.com/xiaxiaoxu/p/9750719.html

时间： 2024-10-11 20:42:12

python自定义方法处理日志文件的相关文章

python 实时遍历日志文件

open 遍历一个大日志文件使用 readlines() 还是 readline() ? 总体上 readlines() 不慢于python 一次次调用 readline(),因为前者的循环在C语言层面,而使用readline() 的循环是在Python语言层面. 但是 readlines() 会一次性把全部数据读到内存中,内存占用率会过高,readline() 每次只读一行,对于读取大文件, 需要做出取舍. 如果不需要使用 seek() 定位偏移, for line in open('fi

【python学习】日志文件里IP访问最多的3个

日志文件例子: #111.172.249.84 - - [12/Dec/2011:05:33:36 +0800] "GET /images/i/goTop.png HTTP/1.0" 200 486 "http://wh.xxxx.com/" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.307

Python 拉取日志文件paramiko

paramiko的另一篇博文:http://467754239.blog.51cto.com/4878013/1619166 场景: 在游戏行业的集群中,日志分析或许是必不可少的,那么为了更方便的管理日志,就是统一存放日志,然后入库数据库 #!/usr/bin/env python #coding:utf8 from multiprocessing import Process from datetime import * import paramiko import string import

python高效解析日志入库

python脚本解析日志文件入库一般有三个重要的步骤:读文件.解析文件.入库.在这三个方面下功夫,可确保我们获得最优的性能(这里不讨论并发) 1 读文件:一次读一行,磁盘IO太多,效率低下:一次性读如全部文件内容,可能内存不够.采取一个折中的办法,每次读若干byte(具体大小视实际情况而定). 经过测试,得到结论,在我们写代码的时候应该这样写 f = open(path,'r') for line in f : ............. 这是系统提供的一种读文件的方法,一般比我们自己每次读若干

python 按照日期切分大日志文件（重点）和按照指定大小切分日志文件

#! /usr/bin/env python # -*- coding:utf8 -*- # 切分nginx 按照日期切分日志文件 from __future__ import division import os,sys big_file='/data/logs/media.net.error.log' # 按照文件大小拆分 def split_by_filesize(fromfile,todir,chunksize=0): """ chunksize: 字节建议每100M

分析nginx大日志文件，python多线程必备! .

还在为分析nginx大日志犯愁吗?也许你会想到用shell处理,1G文件没有问题,上了10G文件,会消耗很久时间,用shell结合python多线程处理没有错. 什么都不用说了,直接上代码了 #!/usr/bin/python #coding:utf8 import threading #载入多线程模块 import time #载入时间模块 import os #载入os模块 import shutil #载入shutil模块 im

【python】多个文件共用日志系统

先写一个最简单的log文件: test_logging5.py #coding:utf-8 import logging logging.debug('logger debug message') logging.info('logger info message') logging.warning('logger warning message') logging.error('logger error message') logging.critical('logger critical m

从Apache的日志文件收集和提供统计数据（一个Python插件架构的简单实现）

从Apache的日志文件收集和提供统计数据这一章我们将介绍基于插件程序的架构和实现.作为例子,我们将构建一个分析Apache服务器log文件的框架.这一次我们不再使用单片机的方式来创建,而是改为采用模块化的方式.一旦我们有了一个基本框架,我们就可以为它创建一个插件.这个插件可以基于请求者的地理位置执行分析. 程序的结构和功能在数据维护和统计收集领域,很难有一个单一的应用程序可以适合多个用户的需求.让我们以分析Apache的web服务器日志文件为例.web服务器接受到的每一个请求都被记录在日志

Python中将打印输出导向日志文件

Python中将打印输出导向日志文件 a. 利用sys.stdout将print行导向到你定义的日志文件中,例如: import sys # make a copy of original stdout route stdout_backup = sys.stdout # define the log file that receives your log info log_file = open("message.log", "w") # redirect pri

猜你喜欢

python的list相关知识

关于list的相关知识 list01 = ['alex',12,65,'xiaodong',100,'chen',5] list02 = [67,7,'jinjiao_dawang','relax19 ...

DOM的小疑问收集

1.DOM,Doncument object model 文档对象模型页面中的所有内容都是对象,包括所有的文字,标签,属性,就是说,DOM就是页面中大对象中有很多小对象,树形结构. 1.1xml文件 ...

构造方法的重载

构造方法重载:方法名相同,与返回值类型无关(构造方法没有返回值),只看参数列表构造方法注意事项 a:如果我们没有给出构造方法,系统将自动提供一个无参构造方法. b:如果我们给出了构造方法,系统将不再 ...

传递给Appium服务器以开启相应安卓Automation会话的Capabilities的几点说明【转】

Desired Capabilities是由客户端发送给Appium服务器端的用来告诉服务器去启动哪种我们想要的会话的一套键值对集合.当中也有一些键值对是用来在自动化的过程中修改服务器端的行为方式的. ...

安卓开发 xml添加滑动条

在layout上显示文字时,因为字数过多不能全部显示,可以添加一个滚动条在layout中 <TextView android:id="@+id/tv" ...

C中#if 0 和#if 1 详解

1我们知道,C标准不提供C++里的"//"这样的单行风格注释而只提供"/* */"这样的块注释功能,我们通常使用它写代码中说明性的注释文字(注释作用)以及在调试 ...

em详解

最近详细阅读了一下CSS2.2文档,对em单位有了深刻的认识原文在此:The 'em' unit is equal to the computed value of the 'font-size' ...

对文本框中输入的内容放大显示和格式化

在最近做的项目中,发现用户在输入手机号.身份证或者银行卡这些重要的数据的时候,文本框显示的文字不是非常大,也不是非常明显的显示给用户. 往往这些重要数据用户都需要核对好几次,在确保正确无误的时候才敢点 ...

探索Oracle之数据库升级十 12c(12.1.0.2)CPU 19774304

探索Oracle之数据库升级十 12c(12.1.0.2)CPU 19774304 一. 补丁描述参考metalink doc: (Doc ID 19774304.8) Bug19774304 ...

包装器的使用

对于不存在Gradle环境的开发者来说,要使用包装器添加这样一个task //包装器 task wrapper(type:Wrapper){ gradleVersion='2.13' } 然后执行 ...

springMVC [email protected]注解（后台控制器获取参数）

在SpringMVC后台控制层获取参数的方式主要有两种,一种是request.getParameter("name"),另外一种是用注解@RequestParam直接获取. 1.获 ...

SpringMvc入门五----文件上传

? 知识点: SpringMvc单文件上传 SpringMvc多文件上传 ? 这里我直接演示多文件上传,单文件的上传就不说了,不过代码都是现成的. 效果预览: ? DEMO图: ? ? 添加文件上传j ...

CSS: 解决Div float后，父Div无法高度自适应的问题

在用CSS+DIV的布局中,经常会发现,当一个DIV float之后,如果他的高度超过了其父DIV的高度时,其父DIV的高度并不会相应的进行调整.要解决这个问题(也叫做闭合(清除)浮动),我们有四种办 ...

MyBatis入参考文档:http://mybatis.org/mybatis-3/zh/ 1.使用MyBatis前的准备 1.增加Maven依赖 <dependency> <gro ...

PCI Express(六) - Simple transactions

原文地址:http://www.fpga4fun.com/PCI-Express6.html Let's try to control LEDs from the PCI Express bus. X ...

FMDB数据库中的一些操作

#pragma mark - 数据库的操作 - (BOOL)judgeModel:(TaskResourceModel *)model isInArray:(NSArray *)shopArray { ...

Jquery+div+css实现弹出登录窗口

基本思路先隐藏(dispaly:none)再显示,半透明蒙版层通过 z-index:9998; z-index:9999; 值越大越在前面 index.html <!DOCTYPE html P ...

张艾迪（创始人）：视觉计算极简主义的设计

AOOOiA.global创始人艾迪张:面临着新互联网的时代的到来.全球各行业对产品设计和色彩搭配上进行了新的色彩标准化.就想人们喜欢Apple的黑与白.喜欢AOOOiA.Global/224 的赤橙 ...

简单的http代理服务器

简单的http代理服务器本项目课程是基于 Python 实现的一个简单的 HTTP 代理服务器,要求用户需了解 Python 基础和一定的 HTTP 服务器基础知识.

leetcode第30题--Next Permutation

problem: Implement next permutation, which rearranges numbers into the lexicographically next greate ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.