XML 是可扩展标记语言(Extensible Markup
Language)的缩写,其中的 标记(markup)是关键部分。它很适合传输数据,解决了跨平台传输对象的问题
XML 文档的第一行可以是一个 XML 声明。这是文件的可选部分,它将文件识别为 XML 文件,有助于工具和人类识别 XML(不会误认为是
SGML 或其他标记)。可以将这个声明简单地写成 <?xml?>
,或包含 XML
版本(<?xml version="1.0"?>
),甚至包含字符编码,比如针对 Unicode
的 <?xml version="1.0"
。因为这个声明必须出现在文件的开头,所以如果打算将多个小的 XML 文件合并为一个大 XML
encoding="utf-8"?>
文件,则可以忽略这个可选信息。
以便条为例的XML文档:
<?xml version="1.0"?>
<小纸条>
<收件人>大元</收件人>
<發件人>小張</發件人>
<主題>問候</主題>
<具體內容>早啊,飯吃了沒? </具體內容>
</小纸条>
命名元素
标记的大小写保持一致
创建 XML 时,要确保开始和结束标记的大小写是一致的。如果大小写不一致,在使用或查看 XML 时将出现错误。例如,如果大小写不一致,Internet
Explorer 将不能显示文件的内容,但它会显示开始和结束标记不一致的消息。
到目前为止,都使用 <recipe>
作为根元素。在 XML
中,先要为元素选择名称,然后再根据这些名称定义相应的 DTD 或
schema。创建名称时可以使用英文字母、数字和特殊字符,比如下划线(_
)。下面给出命名时需要注意的地方:
- 元素名中不能出现空格。
- 名称只能以英文字母开始,不能是数字或符号。(在第一个字母之后就可以使用字母、数字或规定的符号,或它们的混合)。
- 对大小写没有限制,但前后要保持一致,以免造成混乱。
之后就是XML的根元素。在上面的小纸条例子中,此元素就是<小纸条>,而</小纸条>是根元素的结尾标记(即结束标签)。标记中不能以下划线"_"和数字开头任何XML文档都只能有一个根元素。根元素里面,可以有子元素,子元素里面可以有子子元素,元素不能交叉嵌套。以此类推。这样就已经合乎语法了,这称为合法的XML。
但是,根元素到底叫<小纸条>还是<Book>,则是由文档类型定义(DTD校验技术)或XML
Schema校验。如果DTD规定根元素必须叫<小便条>,那你写作<小纸条>就不符合要求。这种不符合DTD或XML纲要的要求的XML文档,被称作没有实效的XML,反之则是有实效的。