照着API文档摸索了两天,发现在DOM中,一个注释(Comment)、一个属性(attribute)、一行文本(textNode)、一个元素(Element)都是一个Node。而有子节点的Node被称为元素(Element).
因此处理XML文档最主要的就是在分辨并处理各种不同的Node.
Dom6.java
package doms;
import javax.xml.parsers.*; //这个包被包括在j2ee 1.4.2 API中。 import org.w3c.dom.*; //这个包被包括在j2se 1.5.0 API中。 import org.xml.sax.*; //这个包被包括在j2ee 1.5.0 API中。
public class Dom6 { public static void main(String[] args) { Dom6 d6 = new Dom6(); System.out.println(d6.parseXML("K:/test11/xml/test.xml")); }
private String getDocumentType(Document doc) { //获取DocumentType信息。为简单起见,不涉及对Entity等的解析。 StringBuffer sb = new StringBuffer(); DocumentType type = doc.getDoctype(); String name = type.getName(); String publicId = type.getPublicId(); String systemId = type.getSystemId(); if (name == null) return ""; sb.append("<!DOCTYPE " + name); sb.append(publicId == null ? "" : " PUBLIC \"" + publicId + "\""); sb.append(systemId == null ? "" : " \"" + systemId + "\""); sb.append(">\n"); return sb.toString(); } private String getElementAttrs(Node node) { //获取一个Element的所有Attribute。 StringBuffer attrs = new StringBuffer(); if (node.hasChildNodes()) { NamedNodeMap map = node.getAttributes(); for (int i = 0; i < map.getLength(); i++) { Node attr = map.item(i); attrs.append(" " + attr.getNodeName() + "=\"" + attr.getNodeValue() + "\""); } } return attrs.toString(); } private String getXMLHeader(Document doc) { //获取XML头定义。 StringBuffer header = new StringBuffer(); String encoding = doc.getXmlEncoding(); String version = doc.getXmlVersion(); boolean standalone = doc.getXmlStandalone(); if (version == null || encoding == null) return ""; //如果没有定义XML头,则返回空串。 header.append("<?xml"); header.append(" version=\"" + version + "\""); header.append(" encoding=\"" + encoding + "\""); header.append(standalone == false ? "" : " standalone=\"true\""); header.append("?>\n"); return header.toString(); } private StringBuffer circle(NodeList list, StringBuffer sb) { //递归调用,获取所有Element和Node。 for (int i = 0; i < list.getLength(); i++) { Node node = list.item(i); if (node.hasChildNodes()) { //如果该节点含有子节点,表明它是一个Element。 String nodeName = node.getNodeName(); sb.append("<" + nodeName + this.getElementAttrs(node) + ">"); //获取该Element的所有Attribute。 sb = this.circle(node.getChildNodes(), sb); //递归调用,操作该Element的子节点。 sb.append("</" + nodeName + ">"); } else if (node.getNodeType() == Node.COMMENT_NODE) { //检查这个非Element节点是否是注释。 sb.append("<!--" + node.getNodeValue() + "-->"); } else { sb.append(node.getNodeValue()); } } return sb; } private String parseXML(String xmlFile) { //解析一个XML文档。 StringBuffer sb = new StringBuffer("///////// ParseXML //////////\n"); try { javax.xml.parsers.DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); javax.xml.parsers.DocumentBuilder builder = factory.newDocumentBuilder(); org.w3c.dom.Document doc = builder.parse(xmlFile); //获取XML文档. sb.append(this.getXMLHeader(doc)); //获取XML头定义。
sb.append(this.getDocumentType(doc)); //获取DocumentType信息。 org.w3c.dom.Element rootElement = doc.getDocumentElement(); //获取根元素。 String rootTagName = rootElement.getTagName(); sb.append("<" + rootTagName + this.getElementAttrs(rootElement) + ">"); if (rootElement.hasChildNodes()) { //一般来说,根元素肯定存在子节点。 sb = this.circle(rootElement.getChildNodes(), sb); //递归调用,操作根元素的子节点。 } sb.append("</" + rootTagName + ">"); } catch (javax.xml.parsers.ParserConfigurationException pce) { } catch (org.xml.sax.SAXException se) { } catch (java.io.IOException ioe) { } return sb.toString(); } }
K:/test11/xml/test.xml
<?xml version="1.0" encoding="GBK"?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app> <!-- Display Name Field --> <display-name>adfadfadsdsafsda</display-name> <!-- Servlet Defination --> <servlet> <servlet-name>Dom1</servlet-name> <servlet-class>doms.Dom1</servlet-class> <init-param> <param-name>name</param-name> <param-value>bitan</param-value> </init-param> </servlet> <!-- Listener List --> <listener> <listener-class>doms.ListenerClass</listener-class> </listener> <!-- Tag Library Mapping --> <taglib> <taglib-uri>tag1.tld</taglib-uri> <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location> </taglib> <!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 --> <myself-tag author="bitan" email="[email protected]"> 下面是一些信息: <test-time>2005年1月14日</test-time> <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version> <text-editer>UltraEdit-32</text-editer> 测试结束。 </myself-tag> </web-app>
结果:
K:\test11>javac -classpath %classpath% -d .\web-inf\classes .\src\Dom6.java
K:\test11>java -classpath .\web-inf\classes doms.Dom6 ///////// ParseXML ////////// <?xml version="1.0" encoding="GBK"?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN " "http://java.sun.com/dtd/web-app_2_3.dtd"> <web-app> <!-- Display Name Field --> <display-name>adfadfadsdsafsda</display-name> <!-- Servlet Defination --> <servlet> <servlet-name>Dom1</servlet-name> <servlet-class>doms.Dom1</servlet-class> <init-param> <param-name>name</param-name> <param-value>bitan</param-value> </init-param> </servlet> <!-- Listener List --> <listener> <listener-class>doms.ListenerClass</listener-class> </listener> <!-- Tag Library Mapping --> <taglib> <taglib-uri>tag1.tld</taglib-uri> <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location> </taglib>
<!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 --> <myself-tag author="bitan" email="[email protected]"> 下面是一些信息: <test-time>2005年1月14日</test-time> <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version> <text-editer>UltraEdit-32</text-editer> 测试结束。 </myself-tag> </web-app>
K:\test11> 
|