1、 XML:extended Markup Language 可扩展标记语言,利用标签和子标签方式描述数据。
2、 声明<?xml version=”1.0”?>版本号
注释<!-- -->
空元素:<x/>标签之间没有内容
3、 每个XML文档必须有且只有一个根元素;根元素是一个完全包括文档中其它所有元素的元素;所有的元素都必须在根元素中定义。
4、 实体在XML中是存储单元,,一个实体可以包含字符串、文件、数据库记录,以及一些其它数据。预定义的符号:“<”“””“>”,在XML文档中使用预定义的实体来代替,书上P527。
5、 CDATA是不被解析器解析的文本。文本内的标签不会被当作标记,实体不会被展开。语法:<![CDATA[ ….. ]]>
6、 XML文档必须是格式良好的(Well-formed):满足XML基本的语法规则。如果XML文档不是格式良好的,就不能被应用程序和浏览器正确识别和解析。
7、 语法规范:
a) 必须有XML声明语句;<?xml version=”1.0”?>
b) 必须有且仅有一个根元素;
c) 标记大小写敏感;
d) 属性值用双引号或单引号;
e) 标记成对;
f) 空标记关闭
g) 元素正确嵌套
8、 有效的XML除了要满足XML规范外,还要满足相应DTD和Schema定义的元素规则;有效的XML一定是格式良好的,但格式良好的XML不一定是有效的。
9、 DOM解析:基于树状结构的API;整个XML文档必须在内存中解析和存储;客户端应用程序可以随机访问这些对象;大型文档则会造成内存紧张。
10、 SAX提供一种用于解析XML文档的事件驱动模型;使用回调机制将事件通知应用程序;特点:不必将整个文件加载到内存中,占用的内存少;不能对文档进行随机访问;SAX是只读的;文档只能遍历一次。