JavaEE XML DOM4J解析

DOM4J解析

@author ixenos

DOM4J常用API



SAXReader reader = new SAXReader();

//Document对象也看成根节点

Document doc = reader.read(File file);

//迭代当前节点下的子节点/也可foreach

Iterator itr = doc.nodeIterator();

While(itr.hasNext()){ Node node = itr.next(); }

//得到根节点

Element  rootElem = doc.getRootElement();

//得到当前标签下指定名称的第一个子标签

Element contactElem = rootElem.element("contact");

//得到当前标签下的的所有子标签

List<Element> list = rootElem.elements();

//获取更深层次的标签(方法只能一层层地获取),XPath!!!当然这只获得第一个

Element nameElem = doc.getRootElement().element("contact").element("name");

//得到指定名称的属性值

String idValue = contactElem.attributeValue("id");

//得到指定属性名称的属性对象

Attribute idAttr = contactElem.attribute("id");

//得到所有属性对象,返回LIst集合

List<Attribute> list = contactElem.attributes();

//得到所有属性对象,返回迭代器

Iterator<Attribute> it = contactElem.attributeIterator();

while(it.hasNext()){ Attribute attr = it.next(); }

//得到当前标签夹着的的Text内容,注意空格和换行也是Text

String content = doc.getRootElement().getText();

//获取文本(先获取标签,再获取标签上的文本)

Element nameELem =doc.getRootElement().element("contact").element("name");

//然后得到文本

String text = nameELem.getText();

System.out.println(text);

//直接得到指定子标签名的文本内容,直接得到phone标签的Text

String text2 = doc.getRootElement().element("contact").elementText("phone");

1、最基本的:Document对象指代整个XML文件

// 读取XML文档,返回Document对象

SAXReader reader = new SAXReader();

// 读取xml文档,返回Document对象

Document doc = reader.read(new File("03.contact.xml"));

2、Document对象的nodeIterator方法迭代下一级,判断是否是Element对象,下一级再用nodeIterator迭代下一级,双重循环,或者用递归,就能遍历所有标签节点

// nodeiterator:得到当前标签节点下的所有子节点对象

Iterator<Node> it = doc.nodeIterator();

while (it.hasNext()) {

Node node = it.next();

String name = node.getName();

System.out.println(name);

// 继续取出下面的子节点

// 只有标签节点才有子节点

// 所以判断当前标签是否标签节点

if (node instanceof Element) {

Element elem = (Element) node;

Iterator<Node> it2 = elem.nodeIterator();

while (it2.hasNext()) {

Node node2 = it2.next();

System.out.println(node2.getName());

}

}

}

DOM4J完整读取XML内容示例


 1 import java.io.File;
 2 import java.util.Iterator;
 3 import java.util.List;
 4
 5 import org.dom4j.Attribute;
 6 import org.dom4j.Document;
 7 import org.dom4j.Element;
 8 import org.dom4j.Node;
 9 import org.dom4j.Text;
10 import org.dom4j.io.SAXReader;
11 import org.junit.Test;
12 /**
13  * 练习-完整读取xml文档内容
14  * @author APPle
15  *
16  */
17 public class Demo3 {
18
19     @Test
20     public void test() throws Exception{
21         //读取xml文档
22         SAXReader reader = new SAXReader();
23         Document doc =
24                 reader.read(new File("./src/contact.xml"));
25
26         //读取根标签
27         Element rootELem = doc.getRootElement();
28
29         StringBuffer sb = new StringBuffer();
30
31         getChildNodes(rootELem,sb);
32
33         System.out.println(sb.toString());
34
35     }
36
37     /**
38      * 获取当前标签的所有子标签
39      */
40     private void getChildNodes(Element elem,StringBuffer sb){
41         //System.out.println(elem.getName());
42
43         //开始标签
44         sb.append("<"+elem.getName());
45
46         //得到标签的属性列表
47         //为什么属性的组装放在循环体外呢?因为此时循环体是获得element根节点的子节点,所以不能组装根标签的属性,只能留待下面的递归配合迭代来曲线救国
48         List<Attribute> attrs = elem.attributes();
49         if(attrs!=null){
50             for (Attribute attr : attrs) {
51                 //System.out.println(attr.getName()+"="+attr.getValue());
52                 //属性值双引号使用转义字符
53                 sb.append(" "+attr.getName()+"=\""+attr.getValue()+"\"");
54             }
55         }
56         sb.append(">");
57
58         //得到文本
59         //String content = elem.getText();
60         //System.out.println(content);
61         Iterator<Node> it = elem.nodeIterator();
62         while(it.hasNext()){
63             Node node = it.next();
64
65             //标签
66             if(node instanceof Element){
67                 Element el = (Element)node;
68                 getChildNodes(el,sb);
69             }
70
71             //文本
72             if(node instanceof Text){
73                 Text text = (Text)node;
74                 sb.append(text.getText());
75             }
76         }
77
78         //结束标签
79         sb.append("</"+elem.getName()+">");
80
81
82
83
84     }
85 }
时间: 2024-08-05 15:49:20

JavaEE XML DOM4J解析的相关文章

JavaEE XML DOM解析

DOM解析XML @author ixenos XML解析方式(原理) a)     DOM 解析树 b)     SAX  流事件 DOM解析对应主流工具 i.          DOM(官方) ii.          DOM4J  (非官方 主流  三大框架使用DOM4J解析配置文件) iii.          JDOM (非官方) SAX解析对应主流工具 SAX (官方  主流) 解析XML文档 a)     要处理XML文档就要先解析(parse)它, b)     解析器程序:读入

DOM4j解析、修改、删除、增加、保存XML的方法

//XML文件 <?xml version="1.0" encoding="gb2312"?> <PhoneInfo> <Brand name="华为" ID="1"> <Type name="P9"> <title>标题信息</title> </Type> </Brand> <Brand name=&qu

【收藏用】--切勿转载JAVA 使用Dom4j 解析XML

原帖地址 : http://blog.csdn.NET/yyywyr/article/details/38359049 解析XML的方式有很多,本文介绍使用dom4j解析xml. 1.环境准备 (1)下载dom4j-1.6.1.jar (2)下载junit-4.10.jar 2.温馨提示 解析XML过程是通过获取Document对象,然后继续获取各个节点以及属性等操作,因此获取Document对象是第一步,大体说来,有三种方式: (1)自己创建Document对象   Document docu

转:在java中使用dom4j解析xml

在java中使用dom4j解析xml 虽然Java中已经有了Dom和Sax这两种标准解析方式 但其操作起来并不轻松,对于我这么一个初学者来说,其中部分代码是活生生的恶心 为此,伟大的第三方开发组开发出了Jdom和Dom4j等工具 鉴于目前的趋势,我们这里来讲讲Dom4j的基本用法,不涉及递归等复杂操作 Dom4j的用法很多,官网上的示例有那么点儿晦涩,这里就不写了 首先我们需要出创建一个xml文档,然后才能对其解析 xml文档: <?xml version="1.0" encod

使用DOM4J解析XMl文件与读取XML文件

XML文件 1 <?xml version="1.0" encoding="UTF-8"?> 2 <bookstore> 3 <book id="1"> 4 <name>冰与火之歌</name> 5 <author>乔治马丁</author> 6 <year>2014</year> 7 <price>89</price&g

DOM4J解析XML

Java中对XML进行解析的方式常见的为四种:SAX,DOM,JDOM,DOM4J     SAX分析器在对XML文档进行分析时,触发一系列的事件,应用程序通过事件处理函数实现对XML文档的访问.由于事件触发本身是有时序性的,因此,SAX分析器提供的是一种对XML文档的顺序访问机制,对于已经分析过的部分,不能再倒回去重新处理. SAX之所以被叫做"简单"应用程序接口,是因为SAX分析器只做了一些简单的工作,大部分工作还要由应用程序自己去做.也就是说,SAX分析器在实现时,它只是顺序地检

java使用dom4j解析xml

目标:将指定XML进行解析,以键=值的方式返回指定节点下的数据 所需要的jar包:dom4j1.6.1.jar.jaxen-1.1.jar <?xml version="1.0" encoding="UTF-8"?> <SOAP-ENV:Envelope xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/" xmlns:SOAP-ENC="http://s

java dom4j解析xml实例(2)

java利用dom4j解析xml 需要的jar包: dom4j官方网站在 http://www.dom4j.org/ 下载dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要加入包jaxen-1.1-beta-7.jar(如果不导入这个架包程序可以执行出结果,但最后会报异常) 将相关jar包引入后,实际解析操作如下:  1.要解析的xml文件province.xml: <china dn="d

Dom4j解析语音数据XML文档(注意ArrayList多次添加对象,会导致覆盖之前的对象)

今天做的一个用dom4j解析声音文本的xml文档时,我用ArrayList来存储每一个Item的信息,要注意ArrayList多次添加对象,会导致覆盖之前的对象:解决方案是在最后将对象添加入ArrayLis时先new 一个对象,然后将之前那个对象的属性set到新的对象中,之后在加入到 ArrayList,就不会出错了. package parseXML; import org.dom4j.Attribute;import org.dom4j.Document;import org.dom4j.E