[python]deteval中groundtruth.xml内容重新排序

#xml api:http://www.cnblogs.com/lhj588/archive/2011/11/09/2242483.html

#dictionary operations: key in dict....

from xml.dom import minidom, Node
doc =
minidom.parse(‘out.xml‘)
tagset=doc.firstChild
image=tagset.firstChild
images={}
while
image:
# print image.toxml()
# props=dir(image)
# print
type(image)
# print type(image)
if hasattr(image,"tagName"):

# print image.tagName+":"
# print
str(eval("image.%s"%"tagName"))
for imagetag in image.childNodes:

imagename=image.getElementsByTagName("imagename")[0].childNodes[0].nodeValue

images[imagename]=image

# if hasattr(imagetag,"tagName"):
# if
imagetag.tagName=="imagename":
# print
imagetag.toxml()

image=image.nextSibling

# for i in images.keys():
# print i

print "<tagset>"
for i in range(1,419):

imagename=str(i)+".jpg"
if images.has_key(imagename):
print
imagename+"formatted"
print images[imagename].toxml()
print
"</tagset>"

时间: 2024-11-07 09:29:13

[python]deteval中groundtruth.xml内容重新排序的相关文章

Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)

1. 项目背景 在Python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间太多了(见上图),从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端的数据处理工作中. 这个项目推出以后受到很大关注,因为开放源码,大家可以在现成源码基础上进一步开发.然而,Python3和Python2是有区别的,<Python即时网络爬虫项目: 内容提取器的定义> 一文的源码无法在Python2.7下使用,本文将发布一个Python2.7的内容提取器. 2.

Python中用ElementTree解析XML

[XML基本概念介绍] XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. 概念一: <foo> # foo元素的起始标签 </foo> # foo元素的结束标签 # note: 每一个起始标签必须有对应的结束标签来闭合, 也可以写成<foo/> 概念二: <foo> # 元素可以嵌套到任意参次 <bar></bar> # bar元素为foo元素的子元素 </f

Python使用ElementTree解析XML【译】

19.7. xml.etree.ElementTree — The ElementTree XML API 源代码: Lib/xml/etree/ElementTree.py Element类型是一种灵活的容器对象,用于在内存中存储层次数据结构.可以说是list和dictionary的交叉. 注意: xml.etree.ElementTree 模块对含有恶意代码的数据是不安全的.如果你想处理不信任的数据请使用 XML vulnerabilities. 每个element都有一系列相关属性: 标签

Python之pptx实现添加内容与删除(移动)页操作

问题背景 大量表格数据需要生成指定格式的ppt文件,内容以文字和表格为主,首尾页与内容有固定格式.博主不熟悉VBA操作,希望通过模板用Python完成自动化. 基本思路 使用xlrd模块读取xlsx文件内容 使用pptx模块完成ppt修改 模块版本 本文完成时使用的Python模块版本如下 pip install xlrd==1.2.0 python-pptx==0.6.18 具体实现 数据读取 有关xls读取参考我的博文:Python之xlrd模块读取xls文件与报错解决 插入页面 网上有很多

Python - 基础中的基础

前景 Python可以应用于众多领域,如:数据分析.组件集成.网络服务.图像处理.数值计算和科学计算等众多领域.目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube.Dropbox.BT.Quora(中国知乎).豆瓣.知乎.Google.Yahoo!.Facebook.NASA.百度.腾讯.汽车之家.美团等. 互联网公司广泛使用Python来做的事一般有:自动化运维.自动化测试.大数据分析.爬虫.Web 等. Python与其他语言 C和Python.java.C# C:代码

python类中super()和__init__()的区别

本文和大家分享的主要是python开发中super()和__init__()的区别,希望通过本文的分享,对初学者学习这部分内容有所帮助. 1.单继承时super()和__init__()实现的功能是类似的 class Base(object): def __init__(self): print 'Base create' class childA(Base): def __init__(self): print 'creat A ', Base.__init__(self) class chi

C#中使用XML指南之读取XML

? C#中使用XML指南之读取XML ? 访问的两种模型: ? 在程序中访问进而操作XML文件一般有两种模型,分别是使用DOM(文档对象模型)和流模型,使用DOM的好处在于它允许编辑和更新XML文档,可以随机访问文档中的数据,可以使用XPath查询,但是,DOM的缺点在于它需要一次性的加载整个文档到内存中,对于大型的文档,这会造成资源问题.流模型很好的解决了这个问题,因为它对XML文件的访问采用的是流的概念,也就是说,任何时候在内存中只有当前节点,但它也有它的不足,它是只读的,仅向前的,不能在文

python使用 minidom创建xml实例

python创建xml实例 模仿下面的xml文件,使用python脚本进行创建. <?xml version='1.0'?> <database> <user username="user" fromAddress="[email protected]" fullName="John Q. User" password="pass"> <subscription host="

MyEclipse中strust.xml代码自动提示

1.首先打开MyEclipse的窗口,选择“Window”菜单下的“Preferences”选项,如图所示 2.在打开的“Preferences”界面中搜索“xml”,选择“XML Catalog”选项,然后选择右边的“Add...”按钮 3.在打开的对话框中,在“location”中输入struts.xml文件所对应的dtd文件的所在位置,最好不要选择有中文的目录,有时候正是因为选择了中文目录,所以没有出现提示. 选择“File System”按钮,找到dtd文件的位置,“E:\struts-