Python实现XML的操作

本文从以下两个方面, 用Python实现XML的操作:

一. minidom写入XML示例1

二. minidom写入XML示例2

三. ElementTree写入/修改示例

四. ElementTree读取/修改/写入示例

一. minidom写入XML示例1

1.引入包

import xml.dom.minidom

2.write XML方法

writexml(writer, indent, addindent, newl, encoding)

writer是文件对象
indent是每个tag前填充的字符,如:‘  ‘,则表示每个tag前有两个空格
addindent是每个子结点的缩近字符,如下面的例子中单引号中我直接用的tab键
newl是每个tag后填充的字符,如:‘\n‘,则表示每个tag后面有一个回车
encoding是生成的XML信息头中的encoding属性值,在输出时minidom并不真正进行编码的处理,如果你保存的文本内容中有汉字,则需要自已进行编码转换。

3.Python代码

#xmlTest_write.py
# -*- coding: utf-8 -*-

import xml.dom.minidom

#生成xml文件
def GenerateXml():
    impl = xml.dom.minidom.getDOMImplementation()
    #设置根结点emps
    dom = impl.createDocument(None, ‘emps‘, None)
    root = dom.documentElement
    employee = dom.createElement(‘emp‘)

    #增加属性
    employee.setAttribute("empno","1111")
    root.appendChild(employee)

    #设置子结点
    #ename
    nameE=dom.createElement(‘ename‘)
    nameT=dom.createTextNode(‘杰克‘)
    nameE.appendChild(nameT)
    #子节点添加属性
    nameE.setAttribute("lastname","克")

    employee.appendChild(nameE)
    #age
    nameE=dom.createElement(‘age‘)
    nameT=dom.createTextNode(‘33‘)
    nameE.appendChild(nameT)

    employee.appendChild(nameE)

    f= open(‘emplist.xml‘, ‘w‘) #w替换为a,追加
    dom.writexml(f, addindent=‘ ‘, newl=‘\n‘)
    f.close()

GenerateXml()

4.写入XML结果

<?xml version="1.0" ?>
<emps>
    <emp empno="1111">
        <ename lastname="克">杰克</ename>
        <age>33</age>
    </emp>
</emps>

二. minidom写入XML示例2

1.Python代码

#Python写xml比较简单,直接使用xml模块的minidom即可对xml文件进行写入操作
    from xml.dom.minidom import Document
    doc = Document()
    people = doc.createElement("people")
    doc.appendChild(people)
    aperson = doc.createElement("person")
    people.appendChild(aperson)
    name = doc.createElement("name")
    aperson.appendChild(name)
    personname = doc.createTextNode("Annie")
    name.appendChild(personname)
    filename = "people.xml"
    f = open(filename, "w")
    f.write(doc.toprettyxml(indent="  "))
    f.close()

2. 写入XML结果

<?xml version="1.0" ?>
<people>
  <person>
    <name>Annie</name>
  </person>
</people>

三. ElementTree写入/修改XML示例

1.写入XMl的Python代码

#coding=utf-8
import xml.etree.ElementTree as ET
#创建根节点
root = ET.Element("root")
#创建root的子节点sub1,并添加属性
firstNode = ET.SubElement(root,"sub1")
firstNode.attrib = {"name":"name attribute","age":"age attribute"}
#创建子节点1(sub1)的子节点sub2,并添加数据
secondNode = ET.SubElement(firstNode,"sub2")
secondNode.text = "test"
#创建elementtree对象,写文件
tree = ET.ElementTree(root)
tree.write("test01.xml")

2. 写入XML结果

<root>
    <sub1 age="age attribute" name="name attribute">
        <sub2>test</sub2>
    </sub1>
</root>

3. 修改XML方法

1. ElementTree.write("xmlfile"):更新xml文件
2. Element.append():为当前element对象添加子元素(element)
3. Element.set(key,value):为当前element的key属性设置value值
4. Element.remove(element):删除为element的节点

4. 修改XML的Python代码

#coding=utf-8
import xml.etree.ElementTree as ET
#读取待修改文件
updateTree = ET.parse("test.xml")
root = updateTree.getroot()
#创建新节点并添加为root的子节点
newEle = ET.Element("NewElement")
newEle.attrib = {"name":"NewElement","age":"20"}
newEle.text = "This is a new element"
root.append(newEle)

#修改sub1的name属性
sub1 = root.find("sub1")
sub1.set("name","New Name")

#修改sub2的数据值
sub2 = root.find("sub1/sub2")
sub2.text = "New Value"

#写回原文件
updateTree.write("test.xml")

5. 修改XML结果

<root>
    <sub1 age="age attribute" name="New Name">
        <sub2>New Value</sub2>
    </sub1>
    <NewElement age="20" name="NewElement">This is a new element</NewElement>
</root>

四. ElementTree读取/修改/写入示例

1. 原始文档内容(test.xml):

<?xml version="1.0" encoding="UTF-8"?>
<framework>
  <processers>
    <processer name="AProcesser" file="lib64/A.so"
      path="/tmp">
    </processer>
    <processer name="BProcesser" file="lib64/B.so" value="fordelete">
    </processer>
    <processer name="BProcesser" file="lib64/B.so2222222"/>
    <services>
      <service name="search" prefix="/bin/search?"
        output_formatter="OutPutFormatter:service_inc">
        <chain sequency="chain1"/>
        <chain sequency="chain2"></chain>
      </service>
      <service name="update" prefix="/bin/update?">
        <chain sequency="chain3" value="fordelete"/>
      </service>
    </services>
  </processers>
</framework>

2. Python操作xml代码:

# -*- coding:utf-8 -*-
‘‘‘
Created on 2018年8月30日
@author: Administrator
‘‘‘
from xml.etree.ElementTree import ElementTree,Element
def read_xml(in_path):
  ‘‘‘‘‘读取并解析xml文件
    in_path: xml路径
    return: ElementTree‘‘‘
  tree = ElementTree()
  tree.parse(in_path)
  return tree
def write_xml(tree, out_path):
  ‘‘‘‘‘将xml文件写出
    tree: xml树
    out_path: 写出路径‘‘‘
  tree.write(out_path, encoding="utf-8",xml_declaration=True)
def if_match(node, kv_map):
  ‘‘‘‘‘判断某个节点是否包含所有传入参数属性
    node: 节点
    kv_map: 属性及属性值组成的map‘‘‘
  for key in kv_map:
    if node.get(key) != kv_map.get(key):
      return False
  return True
#---------------search -----
def find_nodes(tree, path):
  ‘‘‘‘‘查找某个路径匹配的所有节点
    tree: xml树
    path: 节点路径‘‘‘
  return tree.findall(path)
def get_node_by_keyvalue(nodelist, kv_map):
  ‘‘‘‘‘根据属性及属性值定位符合的节点,返回节点
    nodelist: 节点列表
    kv_map: 匹配属性及属性值map‘‘‘
  result_nodes = []
  for node in nodelist:
    if if_match(node, kv_map):
      result_nodes.append(node)
  return result_nodes
#---------------change -----
def change_node_properties(nodelist, kv_map, is_delete=False):
  ‘‘‘‘‘修改/增加 /删除 节点的属性及属性值
    nodelist: 节点列表
    kv_map:属性及属性值map‘‘‘
  for node in nodelist:
    for key in kv_map:
      if is_delete:
        if key in node.attrib:
          del node.attrib[key]
      else:
        node.set(key, kv_map.get(key))
def change_node_text(nodelist, text, is_add=False, is_delete=False):
  ‘‘‘‘‘改变/增加/删除一个节点的文本
    nodelist:节点列表
    text : 更新后的文本‘‘‘
  for node in nodelist:
    if is_add:
      node.text += text
    elif is_delete:
      node.text = ""
    else:
      node.text = text
def create_node(tag, property_map, content):
  ‘‘‘‘‘新造一个节点
    tag:节点标签
    property_map:属性及属性值map
    content: 节点闭合标签里的文本内容
    return 新节点‘‘‘
  element = Element(tag, property_map)
  element.text = content
  return element
def add_child_node(nodelist, element):
  ‘‘‘‘‘给一个节点添加子节点
    nodelist: 节点列表
    element: 子节点‘‘‘
  for node in nodelist:
    node.append(element)
def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
  ‘‘‘‘‘同过属性及属性值定位一个节点,并删除之
    nodelist: 父节点列表
    tag:子节点标签
    kv_map: 属性及属性值列表‘‘‘
  for parent_node in nodelist:
    children = parent_node.getchildren()
    for child in children:
      if child.tag == tag and if_match(child, kv_map):
        parent_node.remove(child)
if __name__ == "__main__":
  #1. 读取xml文件
  tree = read_xml("D://test.xml")
  #2. 属性修改
  #A. 找到父节点
  nodes = find_nodes(tree, "processers/processer")
  #B. 通过属性准确定位子节点
  result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"})
  #C. 修改节点属性
  change_node_properties(result_nodes, {"age": "1"})
  #D. 删除节点属性
  change_node_properties(result_nodes, {"value":""}, True)
  #3. 节点修改
  #A.新建节点
  a = create_node("person", {"age":"15","money":"200000"}, "this is the firest content")
  #B.插入到父节点之下
  add_child_node(result_nodes, a)
  #4. 删除节点
  #定位父节点
  del_parent_nodes = find_nodes(tree, "processers/services/service")
  #准确定位子节点并删除之
  target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"})
  #5. 修改节点文本
  #定位节点
  text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"})
  change_node_text(text_nodes, "new text")
  #6. 输出到结果文件
  write_xml(tree, "D://xiugai.xml")

3.更改之后的内容(xiugai.xml):

<?xml version=‘1.0‘ encoding=‘utf-8‘?>
<framework>
  <processers>
    <processer file="lib64/A.so" name="AProcesser" path="/tmp">
    </processer>
    <processer age="1" file="lib64/B.so" name="BProcesser">
    <person age="15" money="200000">this is the firest content</person></processer>
    <processer age="1" file="lib64/B.so2222222" name="BProcesser"><person age="15" money="200000">this is the firest content</person></processer>
    <services>
      <service name="search" output_formatter="OutPutFormatter:service_inc" prefix="/bin/search?">
        <chain sequency="chain2" />
      </service>
      <service name="update" prefix="/bin/update?">
        <chain sequency="chain3" value="fordelete">new text</chain>
      </service>
    </services>
  </processers>
</framework>

参考文章:

https://docs.python.org/3.5/library/xml.dom.minidom.html
https://docs.python.org/3.5/library/xml.etree.elementtree.html
https://blog.csdn.net/Tcorpion/article/details/75247168?locationNum=8&fps=1
https://blog.csdn.net/tcorpion/article/details/75244681
https://blog.csdn.net/weixin_39909877/article/details/78852287
https://www.jb51.net/article/146558.htm

原文地址:https://www.cnblogs.com/huzixia/p/10391956.html

时间: 2024-10-27 11:27:46

Python实现XML的操作的相关文章

python解析xml文件操作的例子

python解析xml文件操作实例,操作XML文件的常见技巧. xml文件内容: <?xml version="1.0" ?> <!--Simple xml document__chapter 8--> <book> <title> sample xml thing </title> <author> <name> <first> ma </first> <last>

python+selenium自动化软件测试(第12章):Python读写XML文档

XML 即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言.xml 有如下特征: 首先,它是有标签对组成:<aa></aa> 标签可以有属性: <aa id=’123’></aa> 标签对可以嵌入数据: <aa>abc</aa>Python对XML文档读写常用有几个模块: (1) xml.etree.ElementTree ElementTree就像一个轻量级的DOM,具有方便友好的A

Python解析XML文件

python对XML的解析 常见的XML编程接口有DOM和SAX,这两种接口处理XML文件的方式不同,当然使用场合也不同. python有三种方法解析XML,SAX,DOM,以及ElementTree: 1.SAX (simple API for XML ) pyhton 标准库包含SAX解析器,SAX用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件. 2.DOM(Document Object Model) 将XML数据在内存中解析成一个树,通过

Python 读写xml

python对XML的解析 常见的XML编程接口有DOM和SAX,这两种接口处理XML文件的方式不同,当然使用场合也不同. python有三种方法解析XML: SAX,DOM,以及ElementTree: 1.SAX (simple API for XML ) python 标准库包含SAX解析器,SAX用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件. 2.DOM(Document Object Model) 将XML数据在内存中解析成一个树,通

python解析xml之lxml

虽然python解析xml的库很多,但是,由于lxml在底层是用C语言实现的,所以lxml在速度上有明显优势.除了速度上的优势,lxml在使用方面,易用性也非常好.这里将以下面的xml数据为例,介绍lxml的简单使用. [html]?view plain?copy ? 例子:dblp.xml(dblp数据的片段)?? <?xml?version='1.0'?encoding='utf-8'?>???? <dblp>?? ???????<article?mdate="

Python与XML

Python与XML操作 一.介绍 xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,在json还没诞生的黑暗年代,大家只能选择用xml呀,所以,至今很多传统公司如金融行业的很多系统的接口还主要是xml. 二.结构 xml的格式如下,就是通过<>节点来区别数据结构的: <?xml version="1.0"?> <data> <country name="china">

python的XML处理模块ElementTree

ElementTree是python的XML处理模块,它提供了一个轻量级的对象模型.它在Python2.5以后成为Python标准库的一部分,但是Python2.4之前需要单独安装.在使用ElementTree模块时,需要import xml.etree.ElementTree的操作. ElementTree表示整个XML节点树,而Element表示节点数中的一个单独的节点. 构建XML文件 ElementTree(tag),其中tag表示根节点,初始化一个ElementTree对象. Elem

xml文件操作

一.xml文件操作1.了解xml文件的SAX解析方式 1.1SAX解析XML  //第一步:解析xml的对象  //工厂模式   SAXParser parser = SAXParserFactory       .newInstance()       .newSAXParser();  //第二步:获得xml文件   InputStream is = getResources().openRawResource(R.raw.shu);  //第三步: 处理器   DefaultHandler

Python中的切片操作

Python中的切片操作功能十分强大,通常我们利用切片来进行提取信息,进行相关的操作,下面就是一些切片的列子,一起来看看吧,希望对大家学习python有所帮助. 列如我们从range函数1-100中取7的倍数,函数及结果如下所示: >>> for i in range(1,100)[6::7]: print i 7 14 21 28 35 42 49 56 63 70 77 84 91 98 取一个list或tuple的部分元素是非常常见的操作.比如,一个list如下: >>