读代码之htmlParser

在以前使用HtmlParser时，并未考虑过遇到org.htmlparser.tags之外的Tag怎么处理。直到碰到这样的一个标签，如果不加处理，HtmlParser无法对其进行处理。查阅自定义标签之后才明白，控制HtmlParser解析网页结构的是，PrototypicalNodeFactory implements NodeFactory。每一种Tag都需要在NodeFactory中注册一下（registerTag()）。默认注册org.htmlparser.tags中的所有Tag.如果有自定义的Tag,要在里面注册一下。自定义标签可以extends CompositeTag。子类必须实现String[] getIds()方法，注册时提供该类的实例。PrototypicalNodeFactory保存了一个Map<String, Node>.Key为tag的名称，就是getIds()方法返回的String[].Value为注册时提供的实例。在HtmlParser解析过程中，会调用实例的clone()方法构建一个Node。

这也是我第一次见到Java中clone方法的使用。具体clone()方法的调用，以后再看看书吧。。

读代码之htmlParser

时间： 2024-11-06 19:52:15

读代码之htmlParser的相关文章

读代码整洁之道想到的

1.勒布朗法则:later equals never 对于我来说:很多事如果往后拖的话,再重拾的几率就很小,所以要逼迫自己捉住现在,把手头的事情尽可能的做到尽善尽美,否则,日后只会越拖越远. 2.糟糕的代码所带来的深痛影响在于将来他会使你深陷泥沼刚开始写的代码比较简单,但是后面要不断的添加功能,如果以前的代码写得十分冗余,以后再添加新功能所带来的麻烦将是不可估量的.所以代码一开始就要写的简单有效,为以后做铺垫. 3.态度:作为一个程序员,态度很重要:要以专业的态度来对自己的代码负责 4.命名:

《编写可读代码的艺术》读书笔记

表面内容 1.代码的写法应当是别人理解他所需的时间最小化.一条注释可以让你更快理解代码.尽管减少代码行数是一个好目标,但是八里街代码所需的时间最小化是一个更好的目标. 2.选择专业的词,比如函数名使用getxxx(),这个get没有表达出很多信息,是从缓存中得到?从数据库中得到?或者从网络得到?如果是网络,可以用更专业的fetchxxx()或者downloadxxx() 3.tmp,retval这样泛泛的名字,可以根据情况命名,比如tmpFile,让人知道变量是一个临时的文件.(tmp这个名字只

《编写可读代码的艺术》——简单总结

上个月好像冥冥中自有安排一样,我在图书馆看到这本 <编写可读代码的艺术> ( The Art of Readable Code) 期间因为工作的原因,停停看看,这几天终于看完了,可以大概总结如下: 1. 把信息装进名字里,给变量起个好名字 2. 审美,把代码分成段落,对齐 3. 应当取个好名字,而不是用注释去粉饰它 4. 用注释记录你的思想,比如当时为什么要这样写,记录开发过程中有哪些思考 5. 将自己代码中的不足和瑕疵记录下来,方便今后别人的维护,不要顾忌别人的看法! 6. 注释应该言简意赅

《编写可读代码的艺术》---变量和可读性

对变量的草率使用,会导致程序的难以理解,原因是以下几点变量越多,就越难以全部跟踪他们的动向变量的作用域越大,就需要跟踪它的动向越久变量改变的越频繁,就越难以跟踪它的当前值. 下面来讨论如何改善这些问题. 1 减少变量仅当我们需要的时候,才使用变量,下面将列举出一些没必要存在的变量的. 1.1 没有价值的临时变量一般有经验的程序员是不会刻意写个没有价值的临时变量.造成临时变量没有使用价值的原因,可能是多次修修改改之后遗留的结果. 来个日期赋值的例子 DateTime now = Date

读代码还是读文档，来自知乎

题目是陈皓回答的,来自知乎.我只是希望更多的人看到. Jeff Atwood说过这么一句话:“Code Tells You How, Comments Tell You Why”. 其实,Jeff这句话并不准确,另外,我把其扩展一下—— 代码 => What, How & Details文档/书 => What, How & Why 可见,代码并不会告诉你 Why,看代码只能靠猜测或推导来估计Why,是揣测,不准确,所以会有很多误解.而且,我们每个人都知道,Why 这个东西是

如何读代码

作为程序员,如何读懂一段代码是我们必须要掌握的一项基本技能,而写代码则是吃饭的家伙,更是要勤学苦练. 对初学者来说,读懂一行代码并不是一件简单的事,遇到稍微涉及多个循环多个函数的代码往往就会看的晕头晕脑. 所以总结了一下方便初学者读代码的方法,希望大家可以参考. 看注释.注释的用途就是便于编程人员理解代码.多看注释能快速帮助你了解程序实现的功能及程序的组成模块等. 逐行分析.逐行阅读代码,尽量弄清每一句的含义. 善用调试.在调试模式下,我们可以很方便直白的看到随着每一行代码的运行,程序中各个变量

第一次编写简单的中间件测试工具（2） - 读代码的方法

加入新员工训练营的有开发也有测试,大家的coding水平参差不齐. 我发现一个问题,就是当面对一个新学的语言时,我们这期训练营里除了我以外所有的测试人员甚至一些开发人员都不会读代码,不知道怎么去读,或者虽然读了,却一知半解,毫无效率. 首先分享一下我读代码的方法供从手工测试转自动化测试的同学们参考(可能各人思维模式不同,仅供参考): 我读代码时的思维方式属于一级一级严密的逻辑思维,所以一旦我的逻辑链中间断掉,我就不能理解这些代码. 一句话总结:先跑起来,再调试,理解原理,掌握细节. 第一步,看有

读代码

其实我开始读源码才几天时间,但有点心得,就写出来吧,以期抛砖引玉. 阅读源代码的利弊我不谈,我只说该如何读首先是积累,当到了一定条件,你会迫不及待的想要去读,因为你想拥有程序的控制权我把一份陌生的源代码比做一个陌生的城市,你将在里面熟悉道路, 你只要从一个大的标志开始进入(程序入口点)然后你面临很多分支,有的分支很明显的(依靠设计模式,oo,模块化,结构化,解耦,经验判断,当然还有文档,注释,别人的源码分析文章)与其它没有什么瓜葛,或者只有几个联系点,其实是一个模块化功能,就像你知道有一条路

编写可读代码的艺术笔记

编写可读代码的艺术表面层次上的改进命名.注释以及审美--可以用于代码库每一行的小提示. 简化循环和逻辑在程序中定义循环.逻辑和变量,从而使得代码更容易理解. 重新组织你的代码在更高层次上组织大的代码块以及在功能层次上解决问题的方法. 精选话题把"易于理解"的思想应用于测试以及大数据结构代码的例子. 第1章:代码应当易于理解 1.代码应当易于理解. 2.代码的写法应当使别人理解它所需的时间最小化. 第一部分:表面层次的改进第2章:把信息装到名字里 1.使用专业的单词. 2.避

猜你喜欢

跨浏览器resize事件分析

resize事件原生事件分析 window一次resize事件: IE7 触发3次, IE8 触发2次, IE9 触发1次, IE10 触发1次 Chrome 触发1次 FF 触发2次 Opera ...

短视频行业竞争加码开发者点赞趣拍云感恩钜惠活动

一.短视频成为新的创业风口 2016年,短视频超过了图文和组图,成为了今日头条最大的内容形态,日均播放次数超过了10亿次.继第二届头条号创作者大会上宣布对短视频作者投入10亿人民币,今日头条宣布已完成 ...

AES对称加密算法原理

原著:James McCaffrey 翻译:小刀人原文出处:MSDN Magazine November 2003 (Encrypt It) 本文的代码下载:msdnmag200311AES.exe ...

搜索引擎--范例：django之初试牛刀

这学期学了一门课<信息检索>,也就是传说中的搜索引擎大作业自然而然的让我们自己做一个小型的搜索引擎.于是乎,我们本次的主题就诞生了我也是边学边用,下面和大家一起分享我在这个过程中学到的 ...

老男孩40期决心书

1.自我介绍: 我是老男孩运维40期脱产班的"小马过河".我的专业是工商管理,在我选择专业时,只经过短暂的思考就决定了.上学期间,经不住游戏与小说的诱惑而浪费了大量时间.快毕业时我 ...

HDU 1671 Phone List（Trie的应用与内存释放）

Phone List Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total ...

集合视图

集合视图是iOS 6推出的新视图,克服了表视图中一行只能显示一个单元的缺陷.下面来简单看看怎么使用集合视图,一共有5个步骤,如下: 1.自定义单元 2.配置视图控制器 3.内容单元 4.实现流式布局 ...

156_结构体6_布置作业

作业效果: 1 /** 2 * Copyright (c) 1991 - 2016 Arvin Tang. 3 * All rights reserved. 4 * 5 * 文件名称:郝斌C语言视频教 ...

Listview 多个ViewHolder实现

简单代码示例: package com.edaixi.adapter; import android.content.Context; import android.view.View; import ...

Maven依赖图解

传递性依赖和依赖范围 Maven的依赖是具有传递性的,比如A->B,B->C,那么A间接的依赖于C,这就是依赖的传递性,其中A对于B是第一直接依赖,B对于C是第二直接依赖,C为A的传递性依 ...

seq 命令

seq命令用于产生从某个数到另外一个数之间的所有整数. 语法 seq [选项]... 尾数 seq [选项]... 首数尾数 seq [选项]... 首数增量尾数选项 -f, --format ...

毕业设计随录-5

由于今晚兄弟老表举办烧烤活动,所以才这么晚更新随记.今天新闻发布系统主要着手于理清IndexServlet --> MyNewsServlet --> newsTemp.jsp{ne ...

Atitit.  Js 冒泡事件阻止 事件捕获   事件传递  事件代理

Atitit. Js 冒泡事件阻止事件捕获事件传递事件代理 1. 事件冒泡1 2. 事件捕获1 3. 同时支持了事件捕获阶段和事件冒泡阶段ddEventListener的第三个参数1 ...

手写服务器Httpserver

1.创建服务器,并启动(用ServerSocket类) ServerSocket server = new SocketServer(8888); //接受客户端 Socket client = se ...

mac 自认必须记下的 chrome 浏览器快捷键

Mac 下 Chrome 浏览器必须记住的几个快捷键感谢哈尔滨SEO(http://www.harbin-seo.com/by-talk/mac-chrome-shortcuts/)和百度经验, ...

入门Class, ClassLoader

Class类是什么? Class类是一个由当前对象类建模的一个类型, 由当前类的字节码文件生成的对象当前类文件是String.class, 生成对象类型为Class<String> 当前 ...

Predictive Analytics for Business 2

Methodology Map: Methodology map helps us to determine which method I am going to use to solve the b ...

[转]FPGA入门——basys2开发板的伪随机gold码的生成

本文原创,转载请注明出处:http://www.cnblogs.com/risten/p/4166169.html 1.系统原理通过频率控制字选择相位步进,产生访问ROM的地址,进而控制DAC的输出 ...

linux使用括号[]

在bash中,为一个变量指定一个数字值时,可以用美元符号和方括号($[operation])把数学等式括起来! 示例1: [[email protected] ~]# cat test5.sh #!/ ...

使用 dell openmanage server administrator 管理服务器硬盘

今天突然收到领导的通知,服务器空间不够了,需要增加空间,硬件设备已经到位,请帮忙处理. 收到通知后,有些迷糊了,服务器加空间的话,硬盘费用贵(这个不用考虑了,已经到位,是从别的服务器上面拆下来的).现 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.