精华区 [关闭][返回]

当前位置:网易精华区>>讨论区精华>>网络专区>>● 网站建设>>XML>>什么是XML

主题:什么是XML
发信人: quasi()
整理人: eagle(2000-12-24 09:38:50), 站内信件
XML代表Exiensible Markup Language(eXiensible Markup Language的缩写,意
为可
扩展的标记语言)。XML是一套定义语义标记的规则,这些标记将文档分成许多部
件并
对这些部件加以标识。它也是元标记语言,即定义了用于定义其他与特定领域有
关的、语
义的、结构化的标记语言的句法语言。
1.1.1 XML是元标记语言

关于XML要理解的第一件事是,它不只是像超文本标记语言(Hypertexi Markup

Language, nrML)或是格式化的程序。这些语言定义了一套固定的标记,用来描
述一定
数目的元素。如果标记语言中没有所需的标记,用户也就没有办法了。这时只好
等待标记
语言的下一个版本,希望在新版本中能够包括所需的标记,但是这样一来就得依
赖于软件
开发商的选择了。

但是调ML是一种元标记语言。用户可以定义自己需要的标记。这些标记必须根据

些通用的原理来创建,但是在标记的意义上,也具有相当的灵活性。例如,假如
用户正在
处理与家谱有关的事情,需要描述人的出生、死亡、埋葬地、家庭、结婚、离婚
等,这就
必须创建用于每项的标记。新创建的标记可在文档类型定义(Document Type De
finition,
在以后的篇幅中常简称为DTD)中加以描述。在本书的第二部分中将会学到有关D
TD的
更多的知识。现在,只需把DTD看作是一本词汇表和某类文档的句法。例如,在P
e比r
Murray·Rust的ChemicaI Markup Language (化学标记语言,简写为cML)中的
MOL。DTD
文件中描述了词汇表和分子科学的句法:其中包括cnemistry ( fe学)、crysi
al1ography (结
晶学)、solid state physics (固体物理)等词汇。它包括用于atoms (原子
)、mo1ecu1es (分
于)、bonds (化学键)、spectra (光谱)等的标记。这个DTD可与分子科学领
域中的许
多不同的人共享。对于其他领域也有其他的DTD,用户还可以创建自己的DTD。

XML定义了一套元句法,与特定领域有关的标记语言(如MusicML、MathML和cML)

都必须遵守。如果一个应用程序可以理解这一元句法,那么它也就自动地能够理
解所有的
由此元语言建立起来的语言。例览器不必事先了解多种不同的标记语言使用的每
个标记。
事实是,测览器在读入文档或是它的DTD时才了解了给定文档使用的标记。关于如
何显
示这些标记的内容的详细指令是附加在文档上的另外的样式单提供的。例如,考
虑薛定格
(SchrodinRer )方程:
=内平:于平)V(”)v(F,,)
科学论文中充满了这一类方程,但是科学家还必须等待多年,才能让例览器的开
发商
支持书写最基本的数学公Itfifi需的标记。音乐家也有同样的局限性,因为Nets
cape Navigator
和Intemet Explorer还都不支持乐谱。。

有了XML就意味着不必等待例览器的开发商来满足用户的需要了。用户可以创建自

己需要的标记,当需要时,告诉沏览器如何显示这些标记就可以了。

1.1左xML描述的是结构和语义,而不是格式化

关于XML要了解的第二件事是,调ML标记描述的是文档的结构和意义。它不描述

页面元素的格式化。可用样式单为文档增加格式化信息。文档本身只说明文档包
括什么标
记,而不是说明文档看起来是什么样的。

作为对照, HTML文档包括了格式化、结构和语义的标记。<B)就是一种格式化
标记,
它使其中的内容变为粗体。 <STRONG>是一种语义标记,意味着其中的内容特别
重要。 <TD)
是结构标记,指明内容是表中的一个单元。事实上,某些标记可能具有所有这三
种意义。
<Hl>标记可同时表示20磅的He1vet1ca字体的粗体、第一级标题和页面标题。


例如,在HTML中,一首歌可能是用定义标题、定义数据、无序的列表和列表项来

描述的。但是事实上些项目没有一件是与音乐有关的。用HTML定义的歌曲可能如
下:
<dt>Hot Cop
<dd> by Jacques Noralz Henri Belolo and Vzctor
  • Producer : Jacaues Noralz
    <l z >Publisher : PolyGran Records
  • Lenath: 6 : 20
  • Written : 978
    <lz>Artzst : Village People

    而在XML中,同样的数据可能标记为:
    <SONG>
    <TITLE>Hot COD< /TITLE>
    <COMPQSER>Jacques MOral i</CONPOSER>
    <CQNPOSER>Henrz BelOlo< /COMPOSER>
    <COMPOSEH>Vzctor Wxl I zS~/COMPOSER>
    <PRODUCER>Jacques Moraii</ PRODUCER>
    <PUBLIgHER>POly{;ram Records< /PUBLISHER>
    <LENGTH>6 : 20< /LENGTH>
    <YEAR> 978</YEAR>
    <ARTIST>Villaqe People</ARTIST>
    </SONG>
    在这个清单中没有使用通用的标记如<dt>和<li>,而是使用了具有意义的标
    记,如
    <SONG>, <TITLE>、<COMposER>和<yEAR>等。这种用法具有许多优点,
    包括源码易
    于被人阅读,使人能够看出作者的含义。

    XML标记还使非人类的自动机器人易于找出文档中的所有歌曲。在HTML中,机器

    人只能告诉我们这个元素是dt。机器人不能决定dL到底代表一首歌的题目还是定
    义,抑
    或只是一些设计者喜爱的缩进文本格式。事实上,单一文档中可以很好地包括带
    有三种意
    义的各种6仁元素。

    可以选择XML的元素名称,以便使其在附加的上下文中具有额外的意义。例如,元

    素名称可以是数据库的域名。 XML比HTML更为灵活而且适用于各种应用,因为有
    限数
    目的标记不必用于许多不同的目的。

    [转自闪客帝国交流中心新技术追踪论坛]
    http://www.flashempire.com/bbs.html

    --
    御元気ですが? 
    私は元気です。 
    ちょっと風邪ついた。 

    ※ 来源:.月光软件站 http://www.moon-soft.com.[FROM: 202.104.47.196]

  • [关闭][返回]