python解析基于xml格式的日志文件

大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波python解析日志的小脚本。

首先,同样的先看看日志是个啥样。。。

都是xml格式的,是不是看着就头晕了??没事,我们先来分析一波。

1.每一段开头都是catalina-exec,那么我们就按catalina-exec来分,分了之后,他们就都是一段一段的了。

2.然后,我们再在已经分好的一段段里面分,找出你要分割的关键字,因为是xml的,所以,接下来的工作就简单了,都是一个头一个尾的。

3.但是还有一个问题,有可能有的里面没有你想要的关键字,所以你要判断下,如果没有这个字段,那么我就把这个字段设置为空。

思路清晰了,代码自然而然就简单了。

接下来我们就看看代码

#coding:utf-8
import re
#文本所在TXT文件
file = ‘iag_interface.log‘
#分割一段
xml1=‘catalina-exec‘
xml2=‘catalina-exec‘
#关键字reqtimestamp
time1 = ‘<timestamp>‘
time2 = ‘</timestamp>‘
#关键字functionid
functionid1 = ‘<functionid>‘
functionid2 = ‘</functionid>‘
#关键字transid
transid1=‘<transid>‘
transid2=‘</transid>‘
#关键字siappid
siappid1=‘<siappid>‘
siappid2=‘</siappid>‘
#关键字userid
userid1=‘<userid>‘
userid2=‘</userid>‘
#关键字mobnum
mobnum1=‘<mobnum>‘
mobnum2=‘</mobnum>‘
f = open(file,‘r‘,encoding= ‘utf-8‘)
#f = open(file,‘r‘)
#for (num,value) in enumerate(f):
	#print("line number",num,"is:",value)
buff = f.read()
#清除换行符,请取消下一行注释
#buff = buff.replace(‘\n‘,‘‘)
pat	= re.compile(time1+‘(.*?)‘+time2,re.S)
pat1 = re.compile(functionid1+‘(.*?)‘+functionid2,re.S)
pat2 = re.compile(transid1+‘(.*?)‘+transid2,re.S)
pat3 = re.compile(siappid1+‘(.*?)‘+siappid2,re.S)
pat4 = re.compile(userid1+‘(.*?)‘+userid2,re.S)
pat5 = re.compile(mobnum1+‘(.*?)‘+mobnum2,re.S)
pat6=re.compile(xml1+‘(.*?)‘+xml2,re.S)
result6 = pat6.findall(buff)
print(len(result6))
x = open("logfx.txt", ‘w‘)
x.write("===========================开始数据================================="+"\n")
x.write("time"+"\t"+"functionid"+"\t"+"transid"+"\t"+"siappid"+"\t"+"userid"+"\t"+"mobnum"+"\n")
for i in range(0,len(result6)):
	result = pat.findall(result6[i])
	result1 = pat1.findall(result6[i])
	result2 = pat2.findall(result6[i])
	result3 = pat3.findall(result6[i])
	result4 = pat4.findall(result6[i])
	result5 = pat5.findall(result6[i])
	if len(result)==0:
		result.append("空")
	if len(result1)==0:
		result1.append("空")
	if len(result2)==0:
		result2.append("空")
	if len(result3)==0:
		result3.append("空")
	if len(result4)==0:
		result4.append("空")
	if len(result5)==0:
		result5.append("空")
	#print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0])
	x.write("timestamp:"+result[0]+"\t"+result1[0]+"\t"+result2[0]+"\t"+result3[0]+"\t"+result4[0]+"\t"+"mobnum:"+result5[0]+"\n")
x.write("===========================结束数据================================="+"\n")
print("执行完毕!生成文件logfx.txt")
x.close() 

运行下代码

把所有数据运行成功了。接下来查看文件

好了,这个逼就装到这里了,转发请注明出处啊!

时间: 2024-08-06 12:51:24

python解析基于xml格式的日志文件的相关文章

模板--------注册与登录_基于xml格式的存储

代码: 注册与登录_基于xml格式的存储.zip 功能: > 注册(带验证码) > 登录 ------------- JSP: * login.jsp  --> 登录表单 * regist.jsp --> 注册表单 * index.jsp -->  主页(只有登录成功才能看到) Servlet: * LoginServlet * RegistServlet Service: * UserService --> 与用户相关的业务类 Dao: * UserDao -->

pdmreader支持读取xml格式的pdm文件,无法读取二进制格式的pdm文件。

您的Pdm数据字典文件可能不被PDMReader读取,可能是因为pdm文件版本的问题.但 您可以通过PowerDesigner12(下载PowerDesigner12)进行转换 后进行读取. 您要做的就是将bin格式的pdm文件转换为xml格式的pdm文件.如下图.(建议使用PowerDesigner12版本进行转换) 1.转换为XML格式很简单, 用PowerDesigener 12.0(下载PowerDesigner12),打开 您的*.PDM文件    2.选择FILE,然后选择save

教你如何利用xml格式的sitemap文件做好SEO

教你如何利用xml格式的sitemap文件做好SEO 浏览:2289 | 更新:2012-04-10 21:47 一般的网站中都有网站地图文件,它有HTML格式与XML格式,网站地图可以帮助搜索引擎抓取.帮助用户找到自己所需要的内容,它是网站与用户.网站与搜索引擎之间的桥梁,特别是XML格式的地图文件,对于搜索引擎的抓取还是有很大帮助的.下边笔者就说说XML地图文件. 步骤/方法 1 XML地图文件必要放在网站的根目录下边 在谷歌的网站质量指南以及百度SEO官方指南中,也都提到了这一点,必须要把

关于poi导出大数据量EXCEL导出缓慢的解决方案--生成xml格式的表格文件

今天遇到了一个POI导出EXCEL文件结果文件大小太大导致系统运行缓慢的问题.想到了使用输出XML格式的表格来完成. 首先,我们需要理解一下为什么POI导出EXCEL文件会导致文件大小变大.最主要的原因应该是POI变成中经常会对无关的单元格设置属性.例如:一个EXCEL工作表的最大列数为256,我们只使用10列.而编程时经常会将256列全部渲染格式,造成很大的资源浪费.当然应该还有其他很多原因也会造成表格变大. 使用这个方案的前提是对于表格的格式要求不高,因为使用的是自己的工具,没有POI优化了

android开发 服务器端访问MySQL数据库,并把数据库中的某张表解析成xml格式输出到浏览器

我们此时只要写一个Servlet就可以了: public class UpdateMenuServlet extends HttpServlet { /** * */ private static final long serialVersionUID = 1L; // 构造方法 public UpdateMenuServlet() { super(); } // 销毁方法 public void destroy() { super.destroy(); } // 响应Get请求 public

python解析ini、conf、cfg文件

1.使用python自带的ConfigParser模块: #test.cfg文件内容: [sec_a] a_key1 = 20 a_key2 = 10 [sec_b] b_key1 = 121 b_key2 = b_value2 b_key3 = $r b_key4 = 127.0.0.1 # -* - coding: UTF-8 -* - import ConfigParser #生成config对象 conf = ConfigParser.ConfigParser() #用config对象读

C#中使用XmlDocument类来创建和修改XML格式的数据文件

通过XmlDocument类修改XML文档数据,通常需要以下几个主要步骤或其中几个步骤. (1)获取一个包含XML文档数据的XmlDocument类对象,通常有两种方法来实现这个功能: 通过XmlDocument类的构造函数创建不包含任何结点的空对象,常用默认构造函数. (2)通过XmlDocument类的ChildNodes和Item属性获取某个结点(XmlNode类型),通过XmlNode的Name.Value.InnerText等属性修改选中结点的数据. (3)通过XmlDocument类

phpunit 生成三种日志文件的配置方法

#目录结构 windows bin目录下 ├── phpunit.phar ├── phpunit.cmd ├── phpunit.xml ├── build.xml ├── ArrTest.php └── tmp ├── logfile.json ├── logfile.tap └── logfile.xml #日志XML文件配置 新建文件 build.xml 放置在根目录 <logging> <log type="json" target="tmp/1o

从Apache的日志文件收集和提供统计数据(一个Python插件架构的简单实现)

从Apache的日志文件收集和提供统计数据 这一章我们将介绍基于插件程序的架构和实现.作为例子,我们将构建一个分析Apache服务器log文件的框架.这一次我们不再使用单片机的方式来创建,而是改为采用模块化的方式.一旦我们有了一个基本框架,我们就可以为它创建一个插件.这个插件可以基于请求者的地理位置执行分析. 程序的结构和功能 在数据维护和统计收集领域,很难有一个单一的应用程序可以适合多个用户的需求.让我们以分析Apache的web服务器日志文件为例.web服务器接受到的每一个请求都被记录在日志