Java---XML的解析(1)-DOM解析

本章只讲DOM解析。接下来还会学习Dom4j和StAX 解析技术

DOM解析:

DOM解析一次将所有的元素全部加载到内存中:如有以下XML文档:

    <user>
        <name>Jack</name>
        <age>30</age>
    </user>

由于DOM解析,一次性的将所有元素(包含属性和文本) 全部加载到内存中,所以不适用于解析大量的数据。

JAXP-DOM解析:

包: 

javax.xml.parse – 关键类DocumentBuilder,文档解析对像。 

org.w3c.dom – 关键类Document代表内存中的文档对像模型。

java.xml – 关键类Transformer,用于将内存中的文档保存到文件中。

users.xml:-在xml4文件夹下面

<?xml version="1.0" encoding="UTF-8" standalone="no"?><users>
    <user id="A001">
        <name>Tom</name>
        <age>23</age>
    </user>

    <user id="C001">
        <name>李四</name>
        <age>33</age>
    </user>
</users>
<!--添加进来了吧,为了演示而建立的简单xml文档-->

代码演示:

package cn.hncu.dom;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

/**
 * @author 陈浩翔 2016-6-29
 */
public class DomDemo1 {

    @Test
    // 需求:把第一个user节点的name的值取出来
    public void getDom() throws SAXException, IOException,
            ParserConfigurationException {
        // 第一步,通过DocumentBuilderFactory类中的工厂方法等到一个dbf对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        // 第二步,通过dbf对象创建出一个DocumentBuilder对象
        DocumentBuilder db = dbf.newDocumentBuilder();
        // 第三步,通过db对象创建出一个Document对象
        Document dom = db.parse("xml4/users.xml");
        // db.parse( new File("xml4/users.xml") );//也可以

        System.out.println(dom);// [#document: null]

        Node root = dom.getFirstChild();// 这个是根节点
        System.out.println("root:" + root);// root:[users: null]
        System.out.println(root.getNodeName());// users
        System.out.println(root.getFirstChild().getNodeName());// #text
        // 上面一句的输出是:#text ----dom中把空白符也看成是一个Node,这种情况对我们的解析通常会造成很大的麻烦
        // ※※为解决上面的问题,我们以后解析时尽量不要用Node,而要用Element。
        // 因为Element是元素它不包含属性和文字内容(包括空白符),因此可避开空白符的干扰

        Element eRoot = (Element) root;
        NodeList list = eRoot.getElementsByTagName("user");
        System.out.println("user元素的数量:" + list.getLength());

        System.out.println("第2个user元素" + list.item(1));

        Node user1Node = list.item(0);
        Element eUser1 = (Element) user1Node;// 要把Node强转成Element,因为Element是子接口,里面有getElementBy*等方法,而Node没有(只能采用childNodes的方式,这种方式会受空白符的干扰)
        NodeList listNames = eUser1.getElementsByTagName("name");
        String nm = listNames.item(0).getNodeName();// name--标签名
        String nmVal = listNames.item(0).getTextContent();// 标签内部所包含的文本内容----相当于JavaScript中的innerText
        System.out.println(nm + "," + nmVal);
    }

    @Test //需求:把第二个user节点的age值取出来
    public void getAge()throws Exception{
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db = dbf.newDocumentBuilder();
        Document dom = db.parse(new File("xml4/users.xml"));
        Element root = (Element)dom.getFirstChild();
        Element user2 = (Element)root.getElementsByTagName("user").item(1);
        Element eAge = (Element)user2.getElementsByTagName("age").item(0);
        String age = eAge.getTextContent();
        System.out.println("age:"+age);
    }

    //用java对xml文档进行CRUD---创建,遍历,更新,删除
    //创建---需求:添加一个新的user
    @Test
    public void create() throws Exception{
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder db = factory.newDocumentBuilder();
        Document dom = db.parse(new File("xml4/users.xml"));
        Element root = (Element) dom.getFirstChild();

        //创建一个新的user元素
        Element eUserNode = dom.createElement("user");
        eUserNode.setAttribute("id", "C001");//给元素添加属性
        //创建name和age子元素
        Element eName = dom.createElement("name");
        eName.setTextContent("李四");//设置name标签容器中包含的文字
        Element eAgeNode = dom.createElement("age");
        eAgeNode.setTextContent("33");
        //把所创建的元素组装成一颗子树,添加到整颗dom树上
        eUserNode.appendChild(eName);
        eUserNode.appendChild(eAgeNode);
        root.appendChild(eUserNode);

        //再把当前内存中的dom对象存储进xml文件
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer trans = tf.newTransformer();
        trans.transform(new DOMSource(dom), new StreamResult("xml4/users.xml"));

    }

    //遍历---查找
    @Test
    public void query() throws Exception{
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder db = factory.newDocumentBuilder();
        Document dom = db.parse("xml4/users.xml");
        Element root = (Element) dom.getFirstChild();//得到根节点

        NodeList list = root.getElementsByTagName("user");//这个user是xml文档中的元素
        for(int i=0;i<list.getLength();i++){//循环遍历
            Element user = (Element) list.item(i);
            String id = user.getAttribute("id");
            String name = user.getElementsByTagName("name").item(0).getTextContent();
            String age = user.getElementsByTagName("age").item(0).getTextContent();
            System.out.println("id:"+id+",name:"+name+",age:"+age);
            System.out.println("---------------------------------");
        }
    }

    //更新---要求:把最后一个user的年龄+10
    @Test
    public void update() throws Exception{//为了方便,就只抛这个异常了,如果是以后搞项目,一定要详细才行的
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder db = factory.newDocumentBuilder();

        Document dom = db.parse( new File("xml4/users.xml") );

        Element root = (Element) dom.getFirstChild();

        NodeList list = root.getElementsByTagName("user");

        Element eUser = (Element) list.item( list.getLength()-1 );

        String  sAge = eUser.getElementsByTagName("age").item(0).getTextContent();

        int age = Integer.parseInt(sAge)+10;
        System.out.println("age:"+eUser.getElementsByTagName("age").item(0).getTextContent());
        eUser.getElementsByTagName("age").item(0).setTextContent(""+age);
        System.out.println(eUser.getElementsByTagName("age").item(0).getTextContent());

        //把内存中的当前dom对象存储到xml文件中
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer trans = tf.newTransformer();
        trans.transform(new DOMSource(dom), new StreamResult("xml4/users.xml"));
        //把xml源输出到目标---如果目标存在则是更新,否则就是创建

    }

    //删除---需求:删除最后一个元素
    @Test
    public void delete() throws Exception{
        // 第一步,通过DocumentBuilderFactory类中的工厂方法等到一个dbf对象
        DocumentBuilderFactory foctory = DocumentBuilderFactory.newInstance();
        // 第二步,通过dbf对象创建出一个DocumentBuilder对象
        DocumentBuilder db =foctory.newDocumentBuilder();
        // 第三步,通过db对象创建出一个Document对象
        Document dom = db.parse("xml4/users.xml");
        //获取根节点
        Element root =(Element)dom.getFirstChild();

        //获取将要删除的元素
        NodeList list = root.getElementsByTagName("user");
        Element e = (Element)list.item( list.getLength()-1 );
        e.getParentNode().removeChild(e);
        //在内存中已经移除了。

        //把当前内存中的dom对象存储到xml文件中
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer trans = tf.newTransformer();
        trans.transform(new DOMSource(dom), new StreamResult( "xml4/users.xml" ));
    }
}

小知识点:

注意:子类才可以当父类用。

父类的话,如果你确定那个类一定是这个父类的某个子类了,才可以强转为子类!!!

时间: 2024-11-05 13:35:07

Java---XML的解析(1)-DOM解析的相关文章

Java学习总结(21)——XML文档解析:DOM解析,SAX解析

一.XML简介1.可扩展性标记语言(eXtensible Markup Language)2.XML用于描述数据3.应用场合:(1)持久化存储数据(2)数据交换(3)数据配置4.XML语法(1)文档类型:在编写XML文档时,需要先使用文档声明,声明XML文档的类型.最简单的声明语法:<?Xml version="1.0" ?>用encoding属性说明文档的字符编码:<?Xml version="1.0" encoding="GB2312

XML解析之DOM解析技术案例

Java代码: package com.xushouwei.xml; import java.io.File; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.No

【Android进阶】解析XML文件之使用DOM解析器

在前面的文章中,介绍了使用SAX解析器对XML文件进行解析,SAX解析器的优点就是占用内存小.这篇文章主要介绍使用DOM解析器对XML文件进行解析.DOM解析器的优点可能是理解起来比较的直观,当然,每个人对不同的解析方法可能有不同的喜好.但是DOM解析器有个比较大的缺点,就是占用内存比较多,在Android中的XML解析中,还是更推荐其他的解析方式. 下面介绍使用DOM解析器对XML进行解析. 下面是我们需要解析的xml文件 <?xml version="1.0" encodin

使用JAXP对XML文档进行DOM解析

一.XML解析方式分为两种:dom和sax dom:(Document Object Model,即文档对象模型)是W3C组织推荐的解析XML的一种方式. sax:(Simple API for XML)不是官方标准,但它是XML社区事实上的标准,几乎所有的XML解析器都支持它. dom和sax解析方法的区别: dom:对文档CRUD(增删改查)比较方便,缺点:占用内存比较大(将xml文件全部读入内存). sax:占用内存较少,解析速度快(从上往下读一行解析一行).缺点:只适合读取,不适合CRU

Java:简单的解析XML文件之使用DOM解析

XML简介 要理解XML,HTML等格式,先来理解文档对象模型DOM 根据 DOM,HTML 文档中的每个成分都是一个节点,这些节点组成了一棵树.DOM 是这样规定的:整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 节点彼此都有等级关系.HTML 文档中的所有节点组成了一个文档树(或节点树).HTML 文档中的每个元素.属性.文本等都代表着树中的一个节点.树起始于文档节点,并由此继续伸出枝条,直

xml解析之----DOM解析

DOM模型(documentobject model) ?DOM解析器在解析XML文档时,会把文档中的全部元素.依照其出现的层次关系.解析成一个个Node对象(节点). ?在dom中.节点之间关系例如以下: ?位于一个节点之上的节点是该节点的父节点(parent) ?一个节点之下的节点是该节点的子节点(children) ?同一层次,具有同样父节点的节点是兄弟节点(sibling) ?一个节点的下一个层次的节点集合是节点后代(descendant) 父.祖父节点 lNode对象提供了一系列常量来

Android笔记(四十五) Android中的数据存储——XML(一)DOM解析器

DOM解析XML在j2ee开发中比较常见,在Dom解析的过程中,是先把dom全部文件读入到内存中,然后使用dom的api遍历所有数据,检索想要的数据,这种方式显然是一种比较消耗内存的方式,对于像手机这样的移动设备来讲,内存是非常有限的,所以对于比较大的XML文件,不推荐使用这种方式,但是Dom也有它的优点,它比较直观,在xml文档比较小的情况下也可以考虑使用dom方式. 代码演示: MainActivity.java package cn.lixyz.xmltest.activity; impo

XML文件解析之DOM解析

XML文件是一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便.基本的解析方式包括DOM解析和SAX解析,具体来说包括DOM解析,SAX解析,DOM4J解析以及JDOM解析,首先来讲下DOM解析的具体实现方式: 1.重要的对象 DocumentBuilderFactory: 创建文档解析器的工厂对象 DocumentBuilder :得到文档解析器对象,由工长对象获取 Document :文档对象 2.解析XML实现方式 XML文件: <?xml v

XML文档的DOM解析

xml的DOM解析: <?xml version="1.0" encoding="UTF-8"?> <books> <!--根节点--><!--这里的空白也算一个节点,所以books共有5个子节点--> <book id="book1" w="wwwww"> <name><a>AAAAAA</a>bookName1</name