照着API文档摸索了两天,发现在DOM中,一个注释(Comment)、一个属性(attribute)、一行文本(textNode)、一个元素(Element)都是一个Node。而有子节点的Node被称为元素(Element). 
因此处理XML文档最主要的就是在分辨并处理各种不同的Node. 
  
Dom6.java 
package doms; 
import javax.xml.parsers.*; //这个包被包括在j2ee 1.4.2 API中。 import org.w3c.dom.*; //这个包被包括在j2se 1.5.0 API中。 import org.xml.sax.*; //这个包被包括在j2ee 1.5.0 API中。 
public class Dom6 {     public static void main(String[] args) {         Dom6 d6 = new Dom6();         System.out.println(d6.parseXML("K:/test11/xml/test.xml"));        }   
    private String getDocumentType(Document doc) { //获取DocumentType信息。为简单起见,不涉及对Entity等的解析。         StringBuffer sb = new StringBuffer();         DocumentType type = doc.getDoctype();         String name = type.getName();         String publicId = type.getPublicId();         String systemId = type.getSystemId();         if (name == null) return "";                  sb.append("<!DOCTYPE " + name);         sb.append(publicId == null ? "" : " PUBLIC \"" + publicId + "\"");         sb.append(systemId == null ? "" : " \"" + systemId + "\"");         sb.append(">\n");         return sb.toString();     }     private String getElementAttrs(Node node) { //获取一个Element的所有Attribute。         StringBuffer attrs = new StringBuffer();         if (node.hasChildNodes()) {             NamedNodeMap map = node.getAttributes();             for (int i = 0; i < map.getLength(); i++) {                 Node attr = map.item(i);                 attrs.append(" " + attr.getNodeName() + "=\"" + attr.getNodeValue() + "\"");                 }            }           return attrs.toString();      }     private String getXMLHeader(Document doc) { //获取XML头定义。         StringBuffer header = new StringBuffer();         String encoding = doc.getXmlEncoding();          String version = doc.getXmlVersion();         boolean standalone = doc.getXmlStandalone();         if (version == null || encoding == null) return ""; //如果没有定义XML头,则返回空串。         header.append("<?xml");         header.append(" version=\"" + version + "\"");         header.append(" encoding=\"" + encoding + "\"");         header.append(standalone == false ? "" : " standalone=\"true\"");         header.append("?>\n");         return header.toString();     }     private StringBuffer circle(NodeList list, StringBuffer sb) { //递归调用,获取所有Element和Node。         for (int i = 0; i < list.getLength(); i++) {             Node node = list.item(i);             if (node.hasChildNodes()) { //如果该节点含有子节点,表明它是一个Element。                 String nodeName = node.getNodeName();                 sb.append("<" + nodeName + this.getElementAttrs(node) + ">"); //获取该Element的所有Attribute。                 sb = this.circle(node.getChildNodes(), sb); //递归调用,操作该Element的子节点。                 sb.append("</" + nodeName + ">");             } else if (node.getNodeType() == Node.COMMENT_NODE) { //检查这个非Element节点是否是注释。                 sb.append("<!--" + node.getNodeValue() + "-->");             } else {                 sb.append(node.getNodeValue());               }          }            return sb;     }      private String parseXML(String xmlFile) { //解析一个XML文档。         StringBuffer sb = new StringBuffer("///////// ParseXML //////////\n");         try {             javax.xml.parsers.DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();             javax.xml.parsers.DocumentBuilder builder = factory.newDocumentBuilder();             org.w3c.dom.Document doc = builder.parse(xmlFile); //获取XML文档.                          sb.append(this.getXMLHeader(doc)); //获取XML头定义。 
            sb.append(this.getDocumentType(doc)); //获取DocumentType信息。                          org.w3c.dom.Element rootElement = doc.getDocumentElement(); //获取根元素。             String rootTagName = rootElement.getTagName();             sb.append("<" + rootTagName + this.getElementAttrs(rootElement) + ">");             if (rootElement.hasChildNodes()) { //一般来说,根元素肯定存在子节点。                 sb = this.circle(rootElement.getChildNodes(), sb); //递归调用,操作根元素的子节点。               }             sb.append("</" + rootTagName + ">");         } catch (javax.xml.parsers.ParserConfigurationException pce) {                      } catch (org.xml.sax.SAXException se) {                      } catch (java.io.IOException ioe) {                      }         return sb.toString();        } } 
  
  
K:/test11/xml/test.xml 
<?xml version="1.0" encoding="GBK"?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd"> 
<web-app>     <!-- Display Name Field -->     <display-name>adfadfadsdsafsda</display-name>     <!-- Servlet Defination -->     <servlet>         <servlet-name>Dom1</servlet-name>         <servlet-class>doms.Dom1</servlet-class>         <init-param>             <param-name>name</param-name>             <param-value>bitan</param-value>         </init-param>     </servlet>     <!-- Listener List -->     <listener>         <listener-class>doms.ListenerClass</listener-class>     </listener>     <!-- Tag Library Mapping -->     <taglib>         <taglib-uri>tag1.tld</taglib-uri>         <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>     </taglib>          <!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->     <myself-tag author="bitan" email="[email protected]">         下面是一些信息:         <test-time>2005年1月14日</test-time>         <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>         <text-editer>UltraEdit-32</text-editer>         测试结束。     </myself-tag> </web-app> 
   
 
  
结果: 
  
  K:\test11>javac -classpath %classpath% -d .\web-inf\classes .\src\Dom6.java 
K:\test11>java -classpath .\web-inf\classes doms.Dom6 ///////// ParseXML ////////// <?xml version="1.0" encoding="GBK"?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN " "http://java.sun.com/dtd/web-app_2_3.dtd"> <web-app>     <!-- Display Name Field -->     <display-name>adfadfadsdsafsda</display-name>     <!-- Servlet Defination -->     <servlet>         <servlet-name>Dom1</servlet-name>         <servlet-class>doms.Dom1</servlet-class>         <init-param>             <param-name>name</param-name>             <param-value>bitan</param-value>         </init-param>     </servlet>     <!-- Listener List -->     <listener>         <listener-class>doms.ListenerClass</listener-class>     </listener>     <!-- Tag Library Mapping -->     <taglib>         <taglib-uri>tag1.tld</taglib-uri>         <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>     </taglib> 
    <!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->     <myself-tag author="bitan" email="[email protected]">         下面是一些信息:         <test-time>2005年1月14日</test-time>         <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>         <text-editer>UltraEdit-32</text-editer>         测试结束。     </myself-tag> </web-app> 
K:\test11>  
 
  |