通过w3c方式 读取xml内容

/**
     * 通过w3c方式 读取xml内容
     * @param lablenames    要读取的节点名称
     * @param file_path_name 文件绝对路径
     * @return
     */
    public static WebMagic readXML(List<String> lablenames, String file_path_name) {

        WebMagic webMagic = new WebMagic();

        try {
            DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();

            DocumentBuilder builder = factory.newDocumentBuilder();

            org.w3c.dom.Document document = builder.parse(new File(file_path_name));

            org.w3c.dom.Element rootElement = document.getDocumentElement();

            for (int i = 0; i < lablenames.size(); i++) {
                NodeList list = rootElement.getElementsByTagName(lablenames.get(i));

                org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);

                System.out.println(element.getChildNodes().item(0).getNodeValue());

                if ("starturl".equals(element.getNodeName())) {
                    webMagic.setStarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexstarturl".equals(element.getNodeName())) {
                    webMagic.setRegexstarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labelName".equals(element.getNodeName())) {
                    webMagic.setLabelName(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labeltype".equals(element.getNodeName())) {
                    webMagic.setLabeltype(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexdescendants".equals(element.getNodeName())) {
                    webMagic.setRegexdescendants(element.getChildNodes()
                            .item(0).getNodeValue());
                }

            }

        } catch (Exception e) {

            System.out.println("exception:" + e.getMessage());

        }
        return webMagic;

    }
时间: 2024-10-20 10:23:45

通过w3c方式 读取xml内容的相关文章

XML系列:(4)XML解析-JAXP的DOM解析方式读取XML

DOM.SAX和StAX只是解析方式,没有API. JAXP是SUN提供的一套XML解析API.    JAXP(Java API for XMLProcessing,意为XML处理的Java API) JAXP很好的支持DOM和SAX解析. JAXP开发包是JAVASE的一部分,它由java.xml.org.w3c.dom.org.xml.sax包及其子包组成 products.mxl <?xml version="1.0" encoding="UTF-8"

XML系列:(6)XML解析-Dom4j的DOM解析方式读取XML

Dom4j工具,是非官方的,不在jdk中. 使用步骤: 1)导入dom4j的核心包. dom4j-1.6.1.jar 2)编写Dom4j读取xml文件的代码 animals.xml <?xml version="1.0" encoding="UTF-8"?> <Animals> <Cat id="c001" name="喵喵"> <Home>火星</Home> <

java读取xml文件的三种方法

xml既简单又标准,值得拥有和学习,好多地方都用的到.假设有这么一个book.xml: <?xml version="1.0" encoding="ISO-8859-1"?> <!-- Copyright w3school.com.cn --> <!-- W3School.com.cn bookstore example --> -<bookstore> -<book category="childre

c++ 使用xerces读取XML

XML作为一种重要的文件格式,应用面非常之广.从ASP.NET的web.config,到Android的页面设计开发,Webservice通信等.有时候难免需要我们通过程序进行创建与解析,最近刚完成一个C++项目,就需要读取XML配置文件,关于XML解析器的选择很多,可以参考:http://www.metsky.com/archives/578.html. 个人比较喜欢Apache的开源项目,所以使用的是:Xerces.它的使用方法,其实官方上已经有很多demo,详见:http://xerces

jQuery append xmlNode 修改 xml 内容

jQuery append xmlNode 修改 xml 内容 http://blog.darkthread.net/blogs/darkthreadtw/archive/2009/04/29/jquery-xmlext-plugin.aspx jQuery读取xml内容是很简单的操作,但是,要修改就麻烦了.上面给了1个plugin,可以试试: 大家可以下載 jquery.xmlext.js回去玩,或是直接在 Mini jQuery Lab 用以下程式做測試: $.getScript("jque

用Qt读取xml文件,程序执行到 if(!doc.setContent(&amp;file)) 时候出错

看霍亚飞的那本<Qt Creator快速入门>,然后就照着写那个DOM方式读取xml文件的例子出这样的错误. 一开始大家都以为自己的路径会有问题,其实在之前open的时候没问题,怎么可能到后面这里才出问题呢?(自己也在这里绕了很多弯弯) 通过其他方式了解这个函数的原理,其实就是创建一个树,将xml格式的数据保存到一个树一样结构的doc里面去.也就是说,我们在创建这个树的时候出错了,定位一下就知道自己的XML文件是不是错了. 换一个xml,网上下下吧,比较一下发现,原来第一行的<?xml 

unity Android 打包后读取 xml 文件

问题:    前天在做东西的过程中发现了一个让人很纠结的问题,为什么Unity 程序在PC上测试一点都没问题但是打包发布到Android后却无法读取XML文件. 通过查找自资料发现打包发不到安卓后的路径和PC上测试时的路径发生了变化,因此读取就出bug了. 那么解决方法很简单: 1,建立一个新工程 2,添加两个GUItext组件一个用于显示测试平台另一个用于显示读取到的XML数据, 如下: 3,该贴代码了 //-------------------------------------------

简介C#读取XML的两种方式

简介C#读取XML的两种方式 作者: 字体:[增加 减小] 类型:转载 时间:2013-03-03 在程序中访问进而操作XML文件一般有两种模型,分别是使用DOM(文档对象模型)和流模型,使用DOM的好处在于它允许编辑和更新XML文档,可以随机访问文档中的数据,可以使用XPath查询 XML作用 对于XML,想必各位都比较了解,我也就不用费笔墨来描述它是什么了,我想在未来的Web开发中XML一定会大放异彩,XML是可扩展标记语言,使用它企 业可以制定一套自己的数据格式.用于Internet的数据

java读取XML文件的四种方式

java读取XML文件的四种方式 Xml代码 <?xml version="1.0" encoding="GB2312"?> <RESULT> <VALUE> <NO>A1234</NO> <ADDR>河南省郑州市</ADDR> </VALUE> <VALUE> <NO>B1234</NO> <ADDR>河南省郑州市二七区&