XML基本语法

本节要点:

  • 了解XML的文档声明
  • 了解XML的元素、命名规则、属性、元素内容、处理指令等概念

1   XML文档声明

表示该文档是一个XML文档,以及遵循哪个XML版本的规范。

规范:<?xml 版本信息(编码信息)(文档独立性信息)?>

文档声明在XML文件中是可选的第一项,推荐在每个XML文档中都包含文档声明。如果在XML文件中写出了声明就必须包含version属性,表示XML的版本,截止目前XML只有一个版本,即1.0。在XML声明之前不许有任何内容,包括空格。

示例:<?xml version=“1.0” encoding=”UTF-8” standalone=”no”?>

文档声明属性:

encoding属性(可选的):注明XML文档使用的字符编码方式。采用Unicode编码时可以在XML文档声明中省略字符集编码,当XML文档使用非Unicode编码时,必须在XML文档声明中指定其字符集编码

如:< ?xml version=“1.0” encoding=”gb2312”?>

standalone属性(可选的):说明文档是否是独立的,yes(缺省)——该文档没有依赖外面的任何文件而可以独立存在,no——该文档依赖于外面的某个文件

如果同时设置了encoding和standalone属性,standalone属性要位于encoding属性之后。

2   元素

XML的基本组成单位是元素,元素由标记来定义,标记包括起始标记<>和结束标记</>,属性要写在起始标记内。在XML中,所有元素必须有结束标记。

语法样式:

<元素名 属性名=“属性值”>

元素内容

</元素名>

1)   元素内容

可以是其他元素标记、简单的文本、没有任何信息、其他元素标记和文本内容混合等。

嵌套

在一个元素中可以嵌套若干个子元素,如下:

XML标记不能交叉,如下:

2)   元素关系

在XML中,各元素之间是相互关联的。包含在另一个元素中的元素称为子元素,包含子元素的元素称为父元素。嵌套子元素必须完整地包含在它的父元素中

3)   根元素

根元素指没有被嵌套在其他元素内的元素,最高层元素,仅一个。XML文档中所有元素都是根元素的子孙元素。

4)   空元素

不包含任何内容的元素。

3   命名规则

在XML中,可以使用自己需要的元素来扩展标记语言。

命名基本规则:

  • 元素名称不能以数字或特殊字符开头
  • 可以包含字母,数字,下划线等
  • 不能以字符串“XML”作为开头
  • 不能包含空格
  • 尽量不要包含特殊字符
  • 区分大小写

判断对错,如:

区分大小写:

流行的命名规则:

  • 元素名称尽量简短
  • 大小写尽量采用同一标准
    • n  完全用小写字母来书写名称,当名称中包含多个单词时,相互之间用下划线隔开
    • n  将每个单词的首字母大写,不使用分隔符
  • 可以使用非英文字符
    • n  推荐使用英文字符+数字来命

4   元素属性

元素属性是用来对元素做进一步说明的:

在XML中,属性值一定要用双引号或者单引号引起来,否则将被视为错误,推荐先使用双引号。属性区分大小写。

属性也可以被改为使用子元素来描述,但是推荐使用子元素描述数据。

属性不能包含多个值。

5   CDATA & PCDATA

5.1 CDATA

术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。

在 XML 元素中,"<" 和 "&" 是非法的。

"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。

"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

某些文本,比如 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了避免错误,可以将脚本代码定义为 CDATA。

CDATA 部分中的所有内容都会被解析器忽略。

CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束,可以在CDATA区嵌入其它语言的代码。

示例:

<?xml version="1.0" encoding="utf-8" ?>

<people>

<![CDATA[   <!--  !和[之间不要有空白 -->

<teacher>

<name>yeah</name>

<sex>Boy</sex>

<age>22</age>

<add>&address;</add>

</techer>

]]>

</people>

5.2  PCDATA

PCDATA指的是由XML解析器解析的内容,当作一般的文字资料来解读。

PCDATA区是指:

  • 直接写在元素的起始标记和结尾标记之间的内容
  • 由XML解析器解析的内容,当作一般的文字资料来解读
  • XML解析程序会将空格和换行如实地交给下游程序去处理

有些字符不能直接写在pcdata区,如<、&等。

6   注释

注释的内容会被程序忽略而不做解释和处理。

注:不要把注释放在XML的声明之前;注释不能嵌套使用。

7   处理指令

为处理XML文档的应用程序提供提示信息

处理指令格式:

<?处理指令名 处理指令信息?>

<?xml-stylesheet type=“text/css” href=“book.css”?>

XML解析器会把处理指令原封不动地传送给应用程序,由应用程序来解释这个指令,按照它所提供的信息进行处理。

时间: 2024-08-04 21:57:02

XML基本语法的相关文章

XML学习2:XML基本语法(一)

导入 一个XML文件可分为如下几部分内容:文档声明 .元素.属性.注释 .CDATA区 ,特殊字符 .处理指令 (processing instruction)等. 先来看一个简单的XML说明: <?xml version="1.0" encoding="UTF-8"?> <!--上面是文档声明--> <?xml-stylesheet type="text/css" href="XML2.css"

XML XPath语法总结

刚刚遇到一个多重查询xmlDoc.SelectSingleNode("Root/Element[@Name='大气象'][@Age='30']")根据innerText查询xmlDoc.SelectSingleNode("Root/Element[text()='大气象']")顺便收集总结一下.Xml中SelectSingleNode方法中的xpath用法 最常见的XML数据类型有:Element, Attribute,Comment, Text. Element,

一 xml基本语法

一.xml基本语法 1.1 xml介绍 1) xml是可扩展标记语言(EXtensible Markup Language). 2) xml 是独立于软件和硬件的信息传输工具. 3) xml 是以文本的形式存在于一个文本文件中的,一般该文件的后缀名就是".xml",例如: user.xml. 4)xml 的设计宗旨是传输信息(尤其是结构比较复杂的数据),而不是显示数据. 5) xml 可以描绘树状结构的数据.因为这个特点,除了传输数据外,更多的时候我们使用xml作为配置文件. 6) x

xml的语法与创建

xml语法很简单,但很严格,如果出现错误则不能正常解析,而HTML如果出现局部的错误,照样解析 xml第一行必须写xml头<?xml version='1.0' encoding='utf8'?> 如果不写在第一行,则会报错 除了头xml文件只能有一个根标签,根标签中可以有多个标签,这些标签可以嵌套,但不可以交叉嵌套 xml是为了传输数据而生的,而不是显示数据,显示数据用html 标签中可以存在属性:属性必须要有值,属性值必须用引号引起来 注释内容用<!--这里是注释内容--> 在

xml基本语法学习

xml    * 扩展名:*.xml    * 作用:存储.配置    * 语法:        * 文档声明            * 格式:<?xml version="1.0"?>                * version:设置当前xml文档内容使用的版本                * encoding:设置当前xml文档内容使用的编码        * 元素            * 格式:<x></x> or <x /&g

XML——XPATH语法介绍

为什么需要xpath? 在使用dom4j的时候,我们不能跨层获取某一个元素,必须一层一层去获取,这就非常麻烦. 所以为了我们更方便地访问某个节点,我们可以使用xpath技术,它可以让我们非常方便地读取到指定节点. xpath通常结合dom4j配合使用,而且如果要使用xpath,则需要引入一个新的包jaxen-1.1-beta-6.jar xpath的基础语法有以下几点: 1.基本的xpath语法类似于在一个文件系统中定位文件,如果路径以斜线/开始,那么该路径就表示到一个元素的绝对路径. (1)/

XML学习3:XML基本语法(二)

三XML属性 XML元素可以在开始标签中包含属性,类似HTML.属性(Attribute)提供关于元素的额外(附加)信息. XML属性基本语法:<元素 属性1="属性值" 属性2="属性值">元素内容</元素> 注意事项: 1)属性值用双引号(")或单引号(')分隔(如果属性值中有',用"分隔:有",用'分隔). 2)一个元素可以有多个属性. 3)属性名称在同一个元素标记中只能出现一次. 4)属性值不能包括<

XML(一)语法

一.xml语法 1.文档声明 2.元素 3.属性 4.注释 5.CDATA区.转义字符 6.处理指令 1.文档声明: 用来声明xml的基本属性,用来指挥解析引擎如何去解析当前xml 通常一个xml都要包含并且只能包含一个文档声明 xml的文档必须在整个xml的最前面,在文档声明之前,不能有任何内容 <?xml version="1.0" encoding="utf-8"  standalone="yes" ?> version是必须存

xml基本语法(2)

本节要点: 了解XML的文档声明 了解XML的元素.命名规则.属性.元素内容.处理指令等概念 1 XML文档声明 表示该文档是一个XML文档,以及遵循哪个XML版本的规范. 规范:<?xml 版本信息(编码信息)(文档独立性信息)?> <?xml version="1.0" encoding="UTF-8"  standalone="no"?> 文档声明在XML文件中是可选的第一项,推荐在每个XML文档中都包含文档声明.如