DTD-XML的构建模块 无论是XML还是HTML,构建模块(The building blocks)的意思就是类似象<body>....</body>这样的标签。
XML文档的构建模块 所有XML文档(包括HTML文档)都是由以下构建模块所建立
1. Elements 2. Tags 3. Attributes 4. Entities 5. PCDATA 6. CDATA
以下是上述构建模块的摘要介绍
1. Elements(元素) 元素是XML和HTML文档的主构建模块 对于HTML的元素,例如象"body"和"table",而XML的元素,例如象例1的"note"和"message"。 元素包含文本,其他的元素,或者是空元素。 空的HTML元素例如有"hr", "br"和"img"(应该说是没有结尾标签的独立元素)。 2. Tags(标签) 标签是被用来标记元素的 使用象<元素名>这样的开始标签来标记元素的开始, 象</元素名>这样的结束标签来标记元素的结束。
例3: 使用body标签来标记body元素。 <body>body text in between</body> 使用message标签来标记message元素。 <message>some message in between</message>
3. Attributes(属性) 属性提供了关于元素额外的信息 属性经常被内置于元素的开始标签内,并以name/value成对出现。 以下例子是一个含有关于源文件附加信息属性的img元素 例4: <img src="computer.gif" /> 上述例子元素是img,属性名是src,属性数值为computer.gif,因为img在HTML文档内为空元素,所以结尾以"/"结束,没有结束标签。
4. Entities(实体) 实体是定义共同文本的变量,实体的引用就是指引用已经定义好的实体变量。 大家或许都知道HTML文档中象" "这样的实体引用,它是被用于在HTML中插入一个空格, 当文档被XML解析器所解析时,实体被引用赋予事前预定义好的意义。
以下是在XML中预定义的实体 实体名称 所应用的字符 < < > > & & " " ' '
5. PCDATA(被解析字符数据) PCDATA意思是指被解析的字符数据(parsed character data) PCDATA是会被解析器所解析的文本,其中包含在文本里的标签将会被视为标记,而实体将会被引用。
6. CDATA CDATA意思是指字符数据(character data) CDATA是不会被解析器所解析的文本,其中包含在文本里的标签将不会被视为标记,实体也将不会被引用。

|