XML解析(二) SAX解析

XML解析之SAX解析:

SAX解析器:SAXParser类同DOM一样也在javax.xml.parsers包下,此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得。

注意SAXParser的parse()方法:

parse(String uri, DefaultHandler dh),parse(File f, DefaultHandler dh)等都需要传递一个DefaultHandler的对象。

查看API帮助手册可知,SAX解析是事件驱动的,DefaultHandler是SAX2 事件处理程序的默认基类,在 org.xml.sax.helpers 软件包中,由它来实现相关事件的回调,并提供所有回调方法默认的空实现。

DefaultHandler的常用回调方法:

void startDocument():接收文档开始的通知。

void startElement(String uri, String localName, String qName, Attributes attributes): 接收元素开始的通知。

void characters(char[] ch, int start, int length): 接收元素中字符数据的通知。

void endElement(String uri, String localName, String qName):接收元素结束的通知。

void endDocument(): 接收文档结束的通知。

为什么说SAX是推模式解析?

SAX 解析器采用了基于事件的模型,它在解析XML文档的时候可以触发一系列的事件,由解析器自动调用相应事件方法,而不是由我们自己去调用。

使用SAX解析XML,观察各种事件回调:

有如下要解析的xml文件:

 1 <?xml version="1.0" encoding="UTF-8" standalone="no"?>
 2
 3 <students>
 4
 5     <student id="003">
 6
 7         <name>xiaoqiao</name>
 8
 9     </student>
10
11 </students>

解析代码:

 1 public class SaxXmlParser {
 2
 3          public static void main(String[] args) {
 4
 5                    SAXParserFactory factory = SAXParserFactory.newInstance();
 6
 7                    try {
 8
 9                             SAXParser parser = factory.newSAXParser();
10
11                             parser.parse("students_bak.xml", new DefaultHandler(){
12
13                                      @Override
14
15                                      public void characters(char[] ch, int start, int length)
16
17                                                         throws SAXException {
18
19                                                System.out.println("read characters:"+new String(ch,start,length));
20
21                                      }
22
23                                      @Override
24
25                                      public void endDocument() throws SAXException {
26
27                                                System.out.println("end document...");
28
29                                      }
30
31                                      @Override
32
33                                      public void endElement(String uri, String localName, String qName)
34
35                                                         throws SAXException {
36
37                                                System.out.println("end element:<"+qName+">");
38
39                                      }
40
41                                      @Override
42
43                                      public void startDocument() throws SAXException {
44
45                                                System.out.println("start document...");
46
47                                      }
48
49                                      @Override
50
51                                      public void startElement(String uri, String localName, String qName, Attributes attributes)
52
53                                                         throws SAXException {
54
55                                                System.out.println("start element:<"+qName+">");
56
57                                                if(qName.equals("student")){
58
59                                                         System.out.println("id="+attributes.getValue("id"));
60
61                                                }
62
63                                      }
64
65                             });
66
67                    } catch (Exception e) {
68
69                             e.printStackTrace();
70
71                    }
72
73          }
74
75 }

上面代码在parse()方法中,第二个参数定义了一个继承自DefaultHandler的匿名内部类对象,重写了5个主要的事件回调方法,用以观察事件的触发过程。

在startElement()方法中qName存放的是节点名,attributes存放的是该节点的属性,endElement()方法同样。

运行结果:

start document...

start element:<students>

read characters:

start element:<student>

id=003

read characters:

start element:<name>

read characters:xiaoqiao

end element:<name>

read characters:

end element:<student>

read characters:

end element:<students>

end document...

首先回调的是startDocument()方法;

然后碰到<students>节点,回调startElement()方法;

<students>后面有回车,所以会触发characters()方法,输出当前读到的字符;

然后碰到<student>节点,回调startElement()方法,输出id属性值;

后面也有回车,所以会触发characters()方法,输出当前读到的字符;

然后碰到了<name>节点,回调startElement()方法;

后面是xiaoqiao,回调characters()方法;

然后到</name>,回调endElement()方法;

碰到回车,回调characters()方法;

到</student>,回调endElement()方法;

碰到回车,回调characters()方法;

到</students>,回调endElement()方法;

文档结束,回调endDocument()方法,解析工作结束。

如果有需要对文档进行别的处理操作,如查找某个节点等,可以重写响应的事件回调方法,添加上需要的逻辑的实现代码即可。

时间: 2024-08-14 10:33:12

XML解析(二) SAX解析的相关文章

Java SE之XML&lt;二&gt;XML DOM与SAX解析

[文档整理系列] Java SE之XML<二>XML DOM与SAX解析 XML编程:CRUD(Create Read Update Delete) XML解析的两种常见方式: DOM(Document Object Model): 特点:树状解析 优点:[更适合对XML文档的(crud)操作.]对XML文档增删改查操作很方便灵活 缺点:内存消耗很大,不适合数据量很大,节点很多的XML文档. SAX(Simple API for XML): 特点:自上往下顺序解析 优点:[占用内存小,解析速度

Java xml 操作(Dom4J修改xml &#160;&#160;+ xPath技术 &#160;+ SAX解析 + XML约束)

1 XML基础 1)XML的作用 1.1 作为软件配置文件 1.2 作为小型的"数据库" 2)XML语法(由w3c组织规定的) 标签: 标签名不能以数字开头,中间不能有空格,区分大小写.有且仅有一个根标签. 属性: 可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单 双混用. 文档声明: <?xml version="1.0" encoding="utf-8"?> encoding="utf-8&q

JavaWeb-05 XML基础(Dom解析和Sax解析)

JavaWeb-05 JavaWeb-XML基础(Dom解析和Sax解析) 一.XML的概述(了解) eXtensible Markup Language 可扩展标记语言 宗旨是传输数据,而非显示数据. XML标签没有被预定义,需要用户自行定义标签. XML技术是W3C组织(WorldWideWeConsortium万维网联盟)发布的,目前遵循的是W3C组织于2000年发布的XML1.0规范. 作用: a. 传输数据 b. 配置文件(主要用途) XML技术用于解决什么问题? a. XML语言出现

Java学习总结(21)——XML文档解析:DOM解析,SAX解析

一.XML简介1.可扩展性标记语言(eXtensible Markup Language)2.XML用于描述数据3.应用场合:(1)持久化存储数据(2)数据交换(3)数据配置4.XML语法(1)文档类型:在编写XML文档时,需要先使用文档声明,声明XML文档的类型.最简单的声明语法:<?Xml version="1.0" ?>用encoding属性说明文档的字符编码:<?Xml version="1.0" encoding="GB2312

XML.03-DOM和SAX解析

body,td { font-family: calibri; font-size: 10pt } XML.03-DOM和SAX解析 XML的DOM解析 解析 处理 回写 XML的SAX解析 SAX和DOM方式的不同: SAX解析原理 SAX解析范例 解析xml常用的有两种方式,DMO和SAX DOM和SAX的区别: DOM: 在内存中生成树桩结构 优点是可以支持增删改查各种操作 缺点在于,如果文档过大的时候,可能会产生内存溢出的风险 SAX: 基于事件驱动,边读边解析 优点:占用内存小 缺点,

XML 解析---dom解析和sax解析

目前XML解析的方法主要用两种: 1.dom解析:(Document Object Model,即文档对象模型)是W3C组织推荐的解析XML的一种方式. 使用dom解析XML文档,该解析器会先把XML文档加载到内存中,生成该XML文档对应的document对象,然后把XML文档中的各个标签元素变成相应的Element对象,文本会变成Text对象,属性会变成Attribute对象,并按这些标签.文本.属性在XML文档中的关系保存这些对象的关系. 缺点:消耗内存,所以使用dom解析XML文档时不能解

非常简单的XML解析(SAX解析、pull解析)

这里只是把解析的数据当日志打出来了 非常简单的xml解析方式 1 package com.example.demo.service; 2 3 import java.io.IOException; 4 import java.io.InputStream; 5 6 import javax.xml.parsers.DocumentBuilder; 7 import javax.xml.parsers.DocumentBuilderFactory; 8 import javax.xml.parse

java解析XML① 之DOM解析和SAX解析(包含CDATA的问题)

Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档: SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档:SAX采用事件驱动的方式解析XML.如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息.SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理.在SAX的解析过程中,读取到文档开头.文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些

DOM解析和SAX解析的对比

SAX & DOM 解析对比 SAX 解析特点 只读 从上向下 速度快 解析的时候相对比较繁琐,有5个代理方法,每个代理方法都要写一定代码 适合大的 XML 文件解析 在计算机领域,针对 XML 解析,还有 DOM 解析方式,在 PC 端和服务器端被广泛使用 背景 主要用在 PC 端或者服务器端 苹果提供了 NSXML 类支持 DOM 方式的解析 不过 NSXML 类只能用在 MAC 开发,在 iOS 中无法直接使用 DOM 特点 DOM 方式不仅能解析 XML 文档,还能够修改: 增加节点/删