Dom 4j 格式化xml补充 
  
作为一个优秀的XML framework的Dom4j,本身提供了格式化文件的一些方法,让我们看看如何可以更方便的处理。 
本文涉及如何格式化xml输出,设置输出字符集,以及XMLWriter不同的writer方法的区别。 
  
Dom4j提供的格式化xml方法: 
    OutputFormat format = OutputFormat.createPrettyPrint();     XMLWriter writer = new XMLWriter( out, format );     writer.write( document );     writer.close(); 
   |   
  
这里创建一个 OutputFormat 类,用来作为生成XMLWriter的参数。然后创建XMLWriter,调用 write 方法输出 格式化后的 Xml 。 
  
如果你想得到Xml 返回的内容,而不是直接输入到output流里面,可以这样处理: 
| 
     public static String format(Document document){ 
        StringWriter writer = new StringWriter(); 
         
        OutputFormat format = OutputFormat.createPrettyPrint(); 
        format.setEncoding("gb2312");    
        XMLWriter xmlwriter = new XMLWriter( writer, format ); 
        try { 
            xmlwriter.write(document);     
        } catch (Exception e) { 
            e.printStackTrace(); 
        } 
         
        return writer.toString(); 
    }  |   
  
在这里我们创建一个StringWriter类,把XMLWriter输出到StringWriter,然后返回Xml的文本内容。 
  
在这里也许你会很奇怪,为什么不用XMLWriter的 write(String text) 方法, 而是采用write(Document doc)方法呢,下面我们可以做一个试验。 
  
使用write(Document doc)的结果: 
| 
 <?xml version="1.0" encoding="gb2312"?> 
  
<DSTreeRoot text="root根" open="true"> 
  <DsTree text="节点1" open="true"/> 
  <DsTree text="节点2" open="true"/> 
</DSTreeRoot>  |   
  
使用write(String text)的结果: 
| 
 <?xml version="1.0" encoding="UTF-8"?> <DSTreeRoot text="root根" open="true"><DsTree text="节点1" open="true"/><DsTree text="节点2" open="true"/></DSTreeRoot>  |   
  
我们可以看到,使用第二种方法,输出并没有进行格式化,并且输出结果进行了html的转换。详细你可以查看dom4j的源码,在格式化String方法中,默认采用转换方法。 
  
最后在提一点,方法format.setEncoding("gb2312")可以设置输出内容的字符集,也包含了xml文件头声明<?xml version="1.0" encoding="gb2312"?> 。 
    
 
  |