XML基础<第一篇>

一、XML简介

  XML是一种标记语言,用于描述数据,它提供一种标准化的方式来来表示文本数据。XML文档以.xml为后缀。需要彻底注意的是XML是区分大小写的。

  先从一个简单的XML例子来了解下xml基础:

<?xml version="1.0" encoding="utf-8" ?>
<books ISBN="9787544238212">
  <title>xml学习笔记</title>
  <price>30</price>
  <pagecount>300</pagecount>
</books>

  第一行表明,本XML遵守的版本是1.0,使用的字符编码是UTF-8字符集。

  每个XML元素都已一个起始标记开始和一个结束标记结束。比如开始:<title>,结束:</title>。XML元素可以带有属性,属性值要加引号。比如上例中的ISBN就是属性,属性值要加双引号。同时用等号连接。

  一个XML文档只能够有一个根节点,如上例中books就是根节点。

  以下列出XML的几个要点:

  1. XML是一种可扩展标记语言;
  2. XML的标记没有被预定义,用户可以自行定义标记来描述数据;
  3. XML主要用来描述和存储数据;
  4. XML具有自我描述性;
  5. XML是树状结构的文档,是个结构化的文档;
  6. XML文档是个文本文件;

二、XML语法

  1. 每个开始标记都必须有结束标记;
  2. 一个XML文档只能够有一个根元素;
  3. 所有XML元素必须正确嵌套;
  4. 属性值必须加引号;
  5. 一个元素不能有相同的属性;

  下面以示例来解释XML常用的术语。

  1、标记

  标记分为开始标记和结束标记,如<title>就是一个开始标记。</title>就是一个结束标记。开始标记与结束标记之间的内容成为XML元素的内容。如果一个XML元素没有内容,我们称其为空元素。如<title></title>。

  2、元素

  XML元素是从一个开始标记到它结束标记的一段内容。比如 <title>XML学习笔记</title> 就是一个元素。

  3、属性

  一个元素可以带有属性,属性写在开始标记里,写在元素名称的后面。比如<books ISBN="9787544238212">,其中ISBN="9787544238212"就是books元素的一个属性。ISBN 是属性的名称, 9787544238212 是属性值。一个XML元素不能有相同的XML属性名。

三、XML元素之间的关系

  1. 子节点;
  2. 父节点;
  3. 并列节点(兄弟关系);

  下面以一个例子来解释这三种关系。

<?xml version="1.0" encoding="utf-8" ?>
<father>Tom Smith
  <son>
    John Smith
    <grandson>Hans Smith</grandson>
  </son>
  <daughter>Jane Smith</daughter>
</father>

   在上面的例子中,son元素就是father元素的子节点。father元素就是son元素和daughter元素的父节点。son元素和daughter又称并列节点。

  XML元素中可以带有属性作为XML元素的附加信息。

  如果属性值中包含双引号,就用单引号包围属性值。如:

<site info = ‘wo "ai" ni‘>

  如果属性值中包含单引号,就用双引号包围属性值。如:

<site info = "wo ‘ai‘ ni">

  一个XML元素可以有一个或多个属性,每个属性用空格分开。如:

  <person name="zhangsan" age="23">

四、XML名称命名规则

  XML的名称可以包含英文字母和数字,或者其他字符比如下划线。XML名称不能以数字或者标点符号开头,XML不能以xml开头(或者xml的大小写,因为这是XML相关标准的保留词)。XML名称不能包含空格,虽然XML名称支持下划线(_)、连字符(-)、句号(.)和冒号(:),但XML开头不能使用连字符(-)、句号(.)和冒号(:)。

  1、XML实体应用

  (1)、在XML标记里除了表示一个标记的开始之外,不允许有小于号<,因为小于号总是被XML解析器解释为一个标记的开始。

  如 :

<person> if age < 10 </person>

  这行代码是错误的,如果一定要在XML元素内容里书写小于号,那么可以使用小于号的实体引用,即:&lt; 来替换小于号。

  如:

<person> if age &lt; 10</person>

  是正确的写法。

  (2)在XML里也不能使用&这个字符,因为&被解释为某个实体引用的开始。所以必须使用&的实体引用&amp; 来代替&。

  如:

  • <person>a & b</person>     是错误的
  • <person>a &amp; b</person>  是正确的

  下面给出XML5个预定的实体引用

实体引用 字符 说明
&lt; < 小于号
&gt; > 大于号
&amp; &
&apos; 单引号
&quot; " 双引号

  当XML解析器解析含有上述实体引用的XML文档时,会将这些实体引用转换成相应的字符。

  只有<和&在XML是非法的。另外几个是合法的,可以直接写,只是用实体引用更加清晰而已。    

  2、XML CDATA区

  当需要往XML文档里添加一段内容,而内容里有很多<或者&的时候,将所有<或&转换为实体引用是很麻烦的事情,这时候可以使用CDATA区,在CDATA区里不必使用实体引用,因为XML解析器不会计算CDATA区里的内容。

  CDATA区以   <![CDATA[  开始 ,以  ]]>  结束

  示例如下:

     <mycode>
        <![CDATA[
          <html>
            <title></title>
            <body></body>
          </html>
        ]]>
     </mycode>

  需要注意的是:在CDATA区内,不能出现 ]]>

  3、XML注释

  XML注释以  <!--  开始,以  -->  结束。

  示例:

<!-- 这是注释 -->

  在XML注释里面,除了结束符-->,不能出现两个连字符--。XML注释也可以放在元素内容里。

  4、XML声明

  XML文档应当以XML声明开始,不过不是必须的。

  示例:

<?xml version="1.0" encoding="utf-8" standalone="yes" ?>
<person>
    张三
</person>

  如果一个XML文档含有声明,必须放在XML文档的第一行。

  XML文档声明主要有三个参数。

  1. 版本:版本表示遵循的是W3C的XML1.0标准。
  2. 字符编码:字符编码表示该XML文档使用的字符编码方式。对于中文文档,应该使用UTF-8或者Unicode。如果是纯英文,可以使ISO-8859-1编码。
  3. 独立:如果XML standalone的值是no,表示它需要DTD。不需要DTD的XML文档,standalone的值应该写为yes。

  5、格式正确的XML文档。

  • 每个开始标记必须有结束标记。
  • XML文档只有一个根元素。
  • XML元素必须被正确嵌套。
  • XML元素不能有相同名称的属性。
  • XML属性值必须加引号。
  • XML注释不能卸载标记里。
  • XML文档里不能出现<和&标记。必须用实体引用代替。

  6、XML命名空间

  XML命名空间是为了解决当XML文档中存在多个相同名称的元素时,避免冲突而引入的。

  命名空间的语法:

  • xmlns:prefix="URI"
  • xmlns:表示必须的属性。
  • prefix:表示命名空间的别名,它的值不能为xml。
  • URI:用来标识抽象或物理资源的的紧凑字符串。为了保证标识的唯一性,xml采用Internet上的网址作为这个标识符,因为网址是独一无二的。

  默认命名空间示例:

<?xml version="1.0" encoding="utf-8" ?>
<Article xmlns="http://www.xxx.com/"> <!--默认命名空间-->
  <author age="30">张三</author>
  <length>12000</length>
  <price>42</price>
</Article>

  带名字的命名空间|:

<?xml version="1.0" encoding="utf-8" ?>
<h:Article xmlns:h="http://www.xxx.com/"> <!--带前缀的命名空间-->
  <h:author age="30">张三</h:author>
  <h:length>12000</h:length>
  <h:price>42</h:price>
</h:Article>

  7、DTD和XML Schema

  DTD文档类型定义,是一套关于标记符的语法规则。它是XML1.0班规格的一部分,是XML文件的验证机制。属于XML文件组成的一部分。DTD是一种保证XML文档格式正确的有效方法,可以通过比较XML文档和DTD文件来看文档是否符合规范,元素和标签使用是否正确。一个DTD文档包括:元素的定义规则,元素间关系的定义规则,元素可使用的属性、可使用的实体或符号规则。不同的公司之需定义好标准的DTD,个公司都能够依照DTD建立XML文件,并且进行验证,如此就可以轻易的建立标准与交换数据。这样便满足了网络共享和数据交互。

  DTD文件是一个ASCII的文本文件,后缀名为.dtd。每一个XML文档都可以携带一个DTD,用来对该文档格式进行描述,测试该文档是否为有效的XML文档。

  XML Schema如果DTD一样是负责定义和描述XML文档的结构和内容模式的。它可以定义XML文档中存在哪些元素和元素之间的关系,并且可以定义元素和属性的数据类型。是针对DTD的某些缺点,如:DTD不支持数据类型,扩展性较差等而出现的。

  XML Schema具有以下优点:

  •   一致性:Schema使得XML得定义不必再利用一种特定的形式化语言,而是直接借助XML自身的特性,利用XML的基本语法规则来定义XML文档的结构。
  •   扩展性:Schema对DTD进行了扩充,引入了数据类型,命名空间,从而具备较强的可扩展性。
  •   互换性:利用Schema,我们能够书写XML文档以及验证文档的合法性。另外通过特性的映射机制,还可以将不同的Schema进行转换,以实现更高层次的数据交换。
  •   规范性:同DTD一样,Schema野提供了一套完整的机制以约束XML文档中的标记的使用。相比之下Schema基于XML,更具有规范性。
  •   XML Schema的限制功能例如:那些元素可以出现在文档中,元素间的关系是什么,每个元素有那些内容和属性以及元素出现的顺序和次数等等。
时间: 2024-10-29 19:07:37

XML基础<第一篇>的相关文章

FFmpeg深入分析之零-基础 &lt;第一篇&gt;

FFmpeg是相当强大的多媒体编解码框架,在深入分析其源代码之前必须要有基本的多媒体基础知识,否则其源代码会非常晦涩难懂.本文将从介绍一些基本的多媒体只是,主要是为研读ffmpeg源代码做准备,比如一些编解码部分,只有真正了解了多媒体处理的基本流程,研读ffmpeg源代码才能事半功倍. 下面分析一下多媒体中最基本最核心的视频解码过程,平常我们从网上下载一部电影或者一首歌曲,那么相应的多媒体播放器为我们做好了一切工作,我们只用欣赏就ok了.目前几乎所有的主流多媒体播放器都是基于开源多媒体框架ffm

CSS3基础第一篇(圆角,阴影,渐变,选择器)

1.border-radius:1px 2px 3px 2px;  /*添加圆角  四个半径值分别是左上角.右上角.右下角和左下角,顺时针 */ 2.box-shadow:0px 0px 12px 5px #33CC00 inset; /*添加阴影 参数分别是  X轴偏移量 Y轴偏移量  [阴影模糊半径] [阴影扩展半径][阴影颜色]  [投影方式]*/ a.阴影模糊半径与阴影扩展半径的区别 阴影模糊半径:此参数可选,其值只能是为正值,如果其值为0时,表示阴影不具有模糊效果,其值越大阴影的边缘就

Django基础第一篇

目录 1.Django MTV框架简介 2.基础命令创建项目的配置说明 3.前后端交互案例 4.基于数据库实现数据交互增删改查 Django简介 Django框架的设计模式借鉴了MVC的思想,和MVC不同的点是它拆分的三部分,分别为:(Model)模型. (Template)模板.以及(View)视图 MVC和MTV知识点补充: MVC是三个单词的首字母缩写,它们是Model模型.View视图 和Controller控制. 1)最上面的一层,是直接面向最终用户的"视图层"(View).

【SSH三大框架】Hibernate基础第一篇:编写第一个Hibernate程序

接下来这几章节学习的是Hibernate,Hibernate的主要作用就是用来和数据库进行连接,简化了JDBC的操作. 首先,我们创建项目,然后把Hibernate的jar包和sqlserver的驱动导入进去. 接下来,我们须要写一个实体类:User package cn.itcast.hibernate.domain; import java.util.Date; public class User { private int id; //private String name; privat

【SSH三大框架】Spring基础第一篇:搭建Spring环境、实例化Bean、管理Bean的作用域以及Bean的生命周期

一.搭建Spring环境: 在lib目录下引入jar包,然后add to path,这就不过多说了. 二.实例化Bean的三种方式: 首先,我们先写两个java类: 接口类: public interface PersonService { public abstract void save(); } 实现类: public class PersonServiceBean implements PersonService { @Override public void save(){ Syste

黑马程序员--oc基础第一篇

一.oc的基础知识 1.oc的源代码的扩展名为:“.m” 2.不再用include了,改用#import<Foundation/foundation.h>,区别就是import自动检查是否包含了相同的头文件,不需要再在c语言中用IFDef了. 3.类的声明用@interface @end,将声明代码写在两部分之间. 4.BOOL 类型的实质为char typedef signed char BOOL: #define Yes (BOOL) 1 #define No (Bool) 0 5.在oc

【SSH三大框架】Struts2基础第一篇:编写第一个Struts2程序

本年八月份的时候已经是把SSH三层框架学完了,然后又转战Android开发,已经很久没用三大框架做东西了,所以想要花三四天的时间复习一下,就写在博客上. 附带SSH所有jar包网盘下载地址:http://pan.baidu.com/s/1hqf5ta8 首先,我们新创建一个web项目,然后引入jar包:commons-fileupload,commons-io,freemarker,javassist,ognl,struts2-core,xwork-core. 这里只是个简单的struts程序,

JavaSE基础第一篇

1.JDK的安装: 包括JRE 和JVM 下载地址: www.oracle.com/www.sun.com 2.环境变量 set path = "bin所在路径" 设置path环境变量: 方便找到要启动的应用程序 环境变量 path="bin路径" path_home ? 方便对java/bin路径的修改 path(path_home引入path) ;%%JAVA_HOME%/bin; 绿色版与安装版 绿色版:可以其他文件夹,可以正常使用 安装版 3. java的特

webpack基础第一篇(配置文件)

1.安装mode.js.npm本地环境,lue 2.命令语言 mkdir  webpack_demo  //建立文件夹 cd  webpack_demo  //进入文件夹 npm install -g webpack  //全局安装webpack npm init  //初始化 npm install --save-dev webpack //安装目录 3.建立项目基本结构 src文件夹 ----存放编写的源码 dist文件夹 ----存放webpack打包后的文件 dist下建立index.h