java解析XML① 之DOM解析和SAX解析(包含CDATA的问题)

 Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
  SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;SAX采用事件驱动的方式解析XML。如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。

<?xml version="1.0" encoding="utf-8"?>

<Students>
  <Student num="001">
    <name>小明</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="002">
    <name>小红</name>
    <age>21</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="003">
    <name>小蓝</name>
    <age>23</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="004">
    <name>小白</name>
    <age>19</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="005">
    <name>小林子</name>
    <age>18</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="006">
    <name>小东子</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="007">
    <name>小左子</name>
    <age>21</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="008">
    <name>小张</name>
    <age>22</age>
    <subject><![CDATA[数学&英语]]></subject>
  </Student>
  <Student num="009">
    <name>小明</name>
    <age>23</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="010">
    <name>小明</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
</Students>

DOM解析

package cn.yangtze.domtext;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomPractice {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        // 创建一个DocumentBuilderFactory的对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        // 创建一个DocumentBuilder的对象
        try {
            // 创建DocumentBuilder对象
            DocumentBuilder db = dbf.newDocumentBuilder();
            // 通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
            Document document = db.parse("Students.xml");
            // 获取所有Student节点的集合
            NodeList StudentList = document.getElementsByTagName("Student");
            // 通过nodelist的getLength()方法可以获取StudentList的长度
            System.out.println("DOM解析开始...");
            // 遍历每一个Student节点
            for (int i = 0; i < StudentList.getLength(); i++) {
                System.out.println("开始解析第" + (i + 1) + "个学生");
                // 通过 item(i)方法 获取一个Student节点,nodelist的索引值从0开始
                Node book = StudentList.item(i);
                // 获取Student节点的所有属性集合
                NamedNodeMap attrs = book.getAttributes();
                // 遍历Student的属性
                for (int j = 0; j < attrs.getLength(); j++) {
                    // 通过item(index)方法获取Student节点的某一个属性
                    Node attr = attrs.item(j);

                    // 输出学生的属性名和属性值
                    System.out.println(attr.getNodeName() + ":" + attr.getNodeValue());
                }
                NodeList childNodes = book.getChildNodes();
                // 遍历childNodes获取每个节点的节点名和节点值
                for (int k = 0; k < childNodes.getLength(); k++) {
                    // 区分出text类型的node以及element类型的node
                    if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {

                        // 输出子节点的属性名和属性值
                        System.out.println(childNodes.item(k).getNodeName() + ":"
                                + childNodes.item(k).getFirstChild().getNodeValue());

                    }

                }

            }
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("DOM解析结束...");
    }
}

SAX解析 
SAXParserHandler.java

package cn.yangtze.saxtext;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {
    private int StudentIndex = 0;

    // 解析开始的标志
    @Override
    public void startDocument() throws SAXException {
        System.out.println("SAX解析开始...");
    }

    // 解析结束的标志
    @Override
    public void endDocument() throws SAXException {
        System.out.println("SAX解析结束...");
    }

    // 用来遍历XML文件的开始标签
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        // 调用DefaultHandler类的startElement方法
        super.startElement(uri, localName, qName, attributes);
        // 开始解析Student元素节点
        if (qName.equals("Student")) {
            ++StudentIndex;
            System.out.println("开始解析第" + StudentIndex + "个学生");
            //输出XML属性,也就是XML文件中的num属性,注意在因使用属性而引起的一些问题:
            /*1 ,属性无法包含多重的值(元素可以)
            2,属性无法描述树结构(元素可以)
            3,属性不易扩展(为未来的变化)
            4,属性难以阅读和维护
            5,请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。*/
            for (int i = 0; i < attributes.getLength(); ++i) {
                System.out.println(attributes.getQName(i) + ":" + attributes.getValue(i));
            }
        } else if (!qName.equals("Students")) {
            System.out.print(qName + ":");//输出元素值
        }
    }

    // 用来遍历XML文件的结束标签
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        super.endElement(uri, localName, qName);
        // 判断一个学生是否解析完
        if (qName.equals("Student")) {
            System.out.println("结束解析第" + StudentIndex + "个学生");
        }
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        super.characters(ch, start, length);
        String text = new String(ch, start, length);
        if (!text.trim().equals("")) {
            System.out.println(text);
        } // if
    }
}

SAXDemo.java

//SAX解析XML
package cn.yangtze.saxtext;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

public class SAXDemo {
    public static void main(String[] args) {
        File file =new File("Students.xml");
        try {
            // 通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
            SAXParserFactory factory = SAXParserFactory.newInstance();
            // 通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
            SAXParser saxParser = factory.newSAXParser();
            // 定义SAXParserHandler对象
            SAXParserHandler handler = new SAXParserHandler();
            // 解析XML文档
            saxParser.parse(file, handler);
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

原文地址:https://www.cnblogs.com/Koaler/p/11996866.html

时间: 2024-11-08 13:03:16

java解析XML① 之DOM解析和SAX解析(包含CDATA的问题)的相关文章

006_03Java解析XML之DOM方式与SAX方式

XML解析方式分为两种:DOM方式和SAX方式 DOM:Document Object Model,文档对象模型.这种方式是W3C推荐的处理XML的一种方式. SAX:Simple API for XML.这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它. XML解析开发包 JAXP:是SUN公司推出的解析标准实现. Dom4J:是开源组织推出的解析开发包. JDom:是开源组织推出的解析开发包. JAXP: JAXP:(Java API for XML Proc

解析xml文件并且输出(SAX解析器)

本文解析三个xml文件,难度依次增加 文件1:p1.xml <?xml version="1.0" encoding="UTF-8" ?> <persons> <person> <name>张三</name> <age>22</age> </person> </persons> 文件2:p2.xml <?xml version="1.0&quo

JAVA解析XML之DOM方式

JAVA解析XML之DOM方式 准备工作 创建DocumentBuilderFactory对象;    创建DocumentBuilder对象; 通过DocumentBuilder对象的parse方法加载xml 解析XML文件的属性名和属性值 解析XML文件的节点名和节点值 常用方法如下: getElementsByTagName(); getLength(); item(); getNodeName(); getNodeValue(); getNodeType(); *getAttribute

用java操作XML文件(DOM解析方式)

XML 可扩展标记语言(Extensible Markup Language),是独立于软件和硬件的传输工具. XML的作用: (1)用作配置文件 (2)简化数据共享 (3)简化数据传输 XML DOM解析方式 在java工程中导入dom4j.jar包. (一)用java读XML文件 <1>创建SAXReader对象. RAXReader reader=new RAXReader(); <2>调用RAXReader的Document read(File file)方法,获取xml文

[Java开发之路](11)SAX解析XML文档

1. 简介 Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档: SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档: SAX采用事件驱动的方式解析XML.套用网友的解释:如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息.SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理.在SAX的解析过程中,读取到文档开头.文档结尾,元素的开头和元素结尾都

java 解析 xml (DOM方法全)

Java 处理 XML 的三种主流技术及介绍 http://www.ibm.com/developerworks/cn/xml/dm-1208gub/ 这篇文章讲的比较详细,下面我主要介绍 dom方法 对xml文件的增删改操作. 参见http://blog.csdn.net/smcwwh/article/details/7183869 但由于排版有点乱,我整理下我需要的,作为以后的笔记吧... DOM 最大的特点是:实现 W3C 标准,有多种编程语言支持这种解析方式,并且这种方法本身操作上简单快

SAX解析xml (遍历DOM树各节点)

本文参考 http://yangjunfeng.iteye.com/blog/401377 1. books.xml 1 <?xml version="1.0" encoding="UTF-8"?> 2 <bk:books count="3" xmlns:bk="http://test.org/books"> 3 <!--books's comment --> 4 <bk:book i

jaxp解析XML之DOM解析

XML解析技术XML解析方式分为三种一种是DOM解析一种是SAX解析 DOM思想:将整个xml加载入内存,形成围挡对象,所有对xml操作都是对内存中节点对象进行,DOM是官方xml解析标准,同时支持解析其他各种语言 SAX解析方式的出现,因为DOM的解析方式需要对文档进行加载入内存,当文档较大的时候比较消耗资源,这时候就出现了SAX解析SAX思想:一边解析,一边处理,一边释放资源 在JDK6中又引入了另一种StAX解析方式是一种拉模式的xml解析方式,而SAX是一种推模式XML解析方式推模式由服

第十五讲.数据解析(XML与JSON两种数据解析)

一.XML数据解析 1.SAX:Simple API for XML.基于事件驱动的解析方式,逐行解析数据.(采用协议回调机制) NSXMLParser的解析方法: 1 #import "ViewController.h" 2 #import "Model.h" 3 4 @interface ViewController ()<NSXMLParserDelegate> 5 6 @property(nonatomic,strong)UITableView