XML解析器之JAXP与DOM4J

XML是一种数据格式,那么需要对XML文件进行操作就需要用到XML解析器---------针对dom方式和sax方式提供了不同的解析技术-----需要不同的XML解析器

 dom方式:会把文档中所有元素(标签),根据xml的层级结构,解析成各个Node对象(节点)。在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象

    缺点:如果文件过大,造成内存溢出。

    优点:树结构,容易遍历和实现增删改。

 sax方式:采用事件驱动,边读边解析,解析到某一个对象,返回对象名称,可以由用户自己建立自己的对象模型。SAX可以在解析文档的任意时刻停止解析。

    缺点:不能对节点实现增删改操作。

    优点:不受文件大小限制,方便实现查询操作。

DOM(Documeng Object Model)解析器-------JAXP(Java API for XMLProcessing,意为XML处理的Java API)------Java自带的解析xml接口

    解析器存在于------JDK的javax.xml.parsers 包中

      dom方式:DocumentBuilder  : dom解析器类,

           DocumentBuilderFactory:dom解析工厂类

   过程:通过查看API可以发现,而DocumentBuilderFactory是个抽象类,但存在newInstance()方法通过反射的方式得到该接口的实例对象。

 DocumentBuilder是个抽象类,可以通过 DocumentBuilderFactory.newDocumentBuilder()方法得到解析器实例。

 该解析器类存在 parse(File f) 方法返回Document对象,还存在parse(String uri)方法也返回一个Document对象

 而Doucument是个接口,其父接口是Node接口,Document和Node存在一些方法对标签进行操作,详细查看API 。

        getElementsByTagName(String tagname):获取标签, 返回的是 NodeList 集合

        createElement(String tagName):创建标签

        createTextNode(String data):创建文本

        appendChild(Node newChild):将文本添加到标签下面

        removeChild(Node oldChild):删除节点

        getParentNode() :获取父节点

        getTextContent():得到标签里面的内容 

static Document getdocument() throws Exception {

 // 通过工厂解析器类得到Doucment对象

DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentbuilder = builderFactory.newDocumentBuilder();
  // parse()解析xml,返回document 
return documentbuilder.parse(URL);
}

//docuent及其父接口Node有诸多操作标签/属性/文本内容的方法

看具体要求选用具体方法

注意:删除元素需要得到----该元素的父节点删除,不能自己删自己

   在编译器中的增删改----都是对内存操作--因此都需要回写到具体文件中

//回写操作

static void writer(Document document) throws Exception {
  TransformerFactory factory = TransformerFactory.newInstance();
  Transformer transformer = factory.newTransformer();
  transformer.transform(new DOMSource(document), new StreamResult(URL));
}

   sax方式:SAXParser : 解析器类

       SAXParserFactory : 解析器工厂类

 过程:查看API可以发现,SAXParserFactory是个抽象类,可以通过反射的方式newInstance()方法得到该类实例对象。

   SAXParser也是个抽象类, 其实例对象可以通过SAXParserFactory.newSAXParser()得到解析器实例。

   SAXParser对象中存在---parse(File f, DefaultHandler dh)----解析使用指定的指定XML文件的内容DefaultHandler

默认事件自动处理其中存在三个方法:解析开始标签---startElement(String uri, String localName, String qName, Attributes attributes)----返回标签名称

   解析文本内容----characters(char[] ch,int start,int length)------通过string的构造方法,返回文本内容

   解析结束标签-----endElement(String uri,String localName, String qName)-------返回结束标签

         参数File --------xml的路径

         DefaultHandler----默认事件处理器

class MyDefaultHandler extends DefaultHandler {

@Override
public void startElement(String uri, String localName, String qName, Attributes attributes)
throws SAXException {
System.out.print("<"+qName+">");//输出返回的开始标签
}

@Override
public void characters(char[] ch, int start, int length) throws SAXException {
// TODO Auto-generated method stub
System.out.print(new String(ch,start,length));输出返回的结束标签
}

@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
System.out.print("<"+qName+">");输出返回的文本内容
}

}

    

DOM4J(Document Object Model for Java):是dom4j组织提供的一个用来解析处理XML、 XPath和XSLT开源框架,需要导包--dom4j-2.1.1.jar。DOM4J使用接口和抽象基本类方法,hibernate框架使用的解析方式就是DOM4J,该网址可下载dom4j的JAR包------------https://dom4j.github.io-----哈哈哈哈,该网站能快速掌握Dom4j解析器的使用。

   Dom4J中提供如些对象和方法对XML操作:

    SAXReader():SAXReader可以通过多种方式读取xml数据,并返回Document格式的对象。

    Document对象:getRootElement() :获取根节点 ,返回的是Element。

    Element是个接口对象,父接口是Node:getParent():获取父节点

                 addElement():添加标签

                 elements():获取标签下面的所有一层子标签

                 elements(qname):获取标签下面一层中名为qname的子标签

                 element(qname):表示获取表面下面的第一个子标签

                 addElement("xxx"):表示创建名为XXX的子标签

                 setText("YYY"):表示添加值为YYY的标签内容

                 addAttribute("name", "James"):表示添加属性

        对XPath支持--------------selectNodes("xpath表达式"): 多个节点

                    selectSingleNode("xpath表达式"):一个节点

       

SAXReader reader = new SAXReader();  //注意导包----dom4j的import org.dom4j.Document;

Document document = reader.read(url);//import org.dom4j.io.SAXReader;  

// 1、创建解析器
SAXReader saxReader = new SAXReader();
// 2、得到document
Document document = saxReader.read("src/DTD.xml");
// 3、得到根节点
Element element = document.getRootElement();
// 4、获取到第一个person
// 使用element方法
Element elementperson = element.element("person");
// 5、在p1下面添加元素
// 在p1上面直接使用 addElement("标签名称")方法 返回一个Element
Element addelement = elementperson.addElement("段位");
// 6、在添加完成之后的元素下面添加文本
// 在sex上直接使用 setText("文本内容")方法
addelement.setText("黄金");
// 7、回写xml
// 格式化 OutputFormat,使用 createPrettyPrint方法,表示一个漂亮的格式
// 使用类XMLWriter 直接new 这个类 ,传递两个参数
// 第一个参数是xml文件路径 new FileOutputStream("路径")
// 第二个参数是格式化类的值

对XML文件进行修改------需要将修改的内容写到文件

//将修改内容写道文本对象中

方式一FileWriter out = new FileWriter("src/DTD.xml");

    document.write(out);

    out.close();

方式二:将修改内容有格式的写入到文档

    FileWriter fileWiter = new FileWriter("src/DTD.xml");

    XMLWriter writer = new XMLWriter(fileWiter);

    writer.write( document );

    writer.close();

//将修改内容有格式的写入到文档中---有格式

方式三:OutputFormat format = OutputFormat.createPrettyPrint();

    XMLWriter writer = new XMLWriter(new FileOutputStream("src/DTD.xml"),format);

         writer.write(document);
         writer.close();

DTD.xml文件

<history>
  <person>
    <name>貂蝉</name>
    <age>16</age>
    <段位>黄金</段位>
  </person>
  <person>
    <name>皇后</name>
    <name>杨贵妃</name>
    <age>20</age>
  </person>
  <person>
    <name>妃子</name>
    <name>落雁</name>
    <age>19</age>
  </person>
</history>

    Dom4j中可以使用元素迭代器来遍历下一层的元素和属性:elementIterator()----attributeIterator()---hasNext()

     Dom4j中支持XPath语法:不过,需要的导包jaxen-1.2.0.jar---下载路径----https://mvnrepository.com/artifact/jaxen/jaxen/1.2.0

      第一种形式 -----/AAA/DDD/BBB: 表示一层一层的,AAA下面 DDD下面的BBB

        第二种形式---------//BBB: 选取所有 BBB 子元素,而不管它们在文档中的位置。

        第三种形式----------------/*: 所有元素

       第四种形式-----------------BBB[1]: 表示第一个BBB元素  BBB[last()]:表示最后一个BBB元素

      第五种形式--------------//BBB[@id]: 表示只要BBB元素上面有id属性,都得到

      第六种形式----------- //BBB[@id=‘b1‘] 表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1

     常见这六种----详细查看-----https://www.w3school.com.cn/xpath/xpath_syntax.asp

         //1、创建解析器
            SAXReader reader = new SAXReader();
            //2、得到document
            Document document = reader.read("src/DTD.xml");
            //3、得到根节点  getRootElement() 返回Element
            Element element = document.getRootElement();
            //Xpath查询
              Node node = document.selectSingleNode("//name[1]");
            //修改name元素的值为独孤求败
              node.setText("独孤求败");
            /*
             * List<Node> list = element.selectNodes("//name");
             * list for(Node node :
             * list) { System.out.println(node.getText()); }
             */
            //回写文档中
            OutputFormat format = OutputFormat.createPrettyPrint();
            XMLWriter writer = new XMLWriter(new FileOutputStream("src/DTD.xml"),format);
            writer.write(document);
            writer.close();

参考笔记:https://www.cnblogs.com/linkworld/p/7565533.html

原文地址:https://www.cnblogs.com/Tanggula-pioneer/p/11771853.html

时间: 2024-10-22 08:12:54

XML解析器之JAXP与DOM4J的相关文章

XML解析器

一.操作XML文档概述 1.如何操作XML文档 XML文档也是数据的一种,对数据的操作也不外乎是"增删改查".也被大家称之为"CRUD" C:Create: R:Retrieve: U:Update: D:Delete 2.XML解析技术 XML解析方式分为两种:DOM(Document Object Model)和SAX(Simple API for XML).这两种方式不是针对Java语言来解析XML的技术,而是跨语言的解析方式.例如DOM还在Javascrip

JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析(8)

1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出.语法:<![CDATA[ 内容 ]]> <![CDATA[ <book> <br/> </book> ]]> 2.处理指令处理指令,简称PI (processing instruction).处理指令用来指挥解析引擎如何解析XML文

Android学习xml解析大全之SAX和DOM

  随着android的学习解析xml成为了很多朋友面临的问.想学习如何解析xml就要先了解xml是什么. XML称为可扩展标记语言(Extensible Markup Language),由标准通用标记语言(SGML:Standard Generalized Markup Language)发展而来,允许开发者自定义标签,可以实现标签和内容的有效分离. 与HTML不同,XML不再侧重于数据如何表现,而是更多的关注数据如何存储和传输.因此,XML逐渐演变成为一种跨平台的数据交换格式.通过使用XM

利用JAXP和DOM4J解析XML

前言 原创文章欢迎转载,请保留出处. 若有任何疑问建议,欢迎回复. 邮箱:[email protected] 解析XML主要有两种思想,一种是SAX(Simple API for XML),另一种是DOM(文档对象模型),其中在J2EE中,提供了JAXP来实现这两种解析,本文主要利用JAXP实现SAX解析,同时介绍时下流行的DOM4J实现DOM解析. SAX解析和DOM解析比较 SAX解析 优点:效率高,当遇到大的XML文件时,不需要扫描完文件就可以操作. 缺点:不能进行RUD操作,每次操作都要

xml解析-dom4j(比较流行,第三方提供)

需要导入dom4j的包,以提供dom4j的支持. package day06_parser.dom4j; /**dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的 DOM4J是dom4j.org出品的一个开源XML解析包,它的网站中这样定义: Dom4j is an easy to use, open source library for working with XML, XPath and XSLT on the Java platform using the J

javaweb学习总结十(xml解析&lt;JAXP以及DOM方式&gt;)

一:XML解析技术 一般我们使用sun公司或者开源组织开发的工具包解析xml效率比较高. 1:jaxp解析xml,jaxp是sun公司开发的解析xml工具包 2:jaxp解析xml代码如下 a:获取document文档树对象 1 @Test 2 // 获取document对象 3 public void test1() throws Exception { 4 // 1:获取解析工厂对象 5 DocumentBuilderFactory factory = DocumentBuilderFact

XML系列:(4)XML解析-JAXP的DOM解析方式读取XML

DOM.SAX和StAX只是解析方式,没有API. JAXP是SUN提供的一套XML解析API.    JAXP(Java API for XMLProcessing,意为XML处理的Java API) JAXP很好的支持DOM和SAX解析. JAXP开发包是JAVASE的一部分,它由java.xml.org.w3c.dom.org.xml.sax包及其子包组成 products.mxl <?xml version="1.0" encoding="UTF-8"

XML系列:(5)XML解析-JAXP的DOM解析方式修改XML

DOM.SAX和StAX只是解析方式,没有API. JAXP是SUN提供的一套XML解析API.JAXP(Java API for XMLProcessing,意为XML处理的Java API) JAXP很好的支持DOM和SAX解析. JAXP开发包是JAVASE的一部分,它由java.xml.org.w3c.dom.org.xml.sax包及其子包组成 1.以DOM解析方式修改XML 1.1.将Document树保存到文件中 package com.rk.xml.e_jaxp_dom_writ

XML系列:(6)XML解析-Dom4j的DOM解析方式读取XML

Dom4j工具,是非官方的,不在jdk中. 使用步骤: 1)导入dom4j的核心包. dom4j-1.6.1.jar 2)编写Dom4j读取xml文件的代码 animals.xml <?xml version="1.0" encoding="UTF-8"?> <Animals> <Cat id="c001" name="喵喵"> <Home>火星</Home> <