1. 必要性
Excel是一种常见的文档格式,通常情况下大多数的客户都对使用Excel十分的精通。对于我们来说,客户善于使用就可以使我们免于培训的烦恼。而某些系统往往需要录入相当量的数据,这些数据一般以某种特定的格式保存。而Excel正是一种相当规格的数据保存方式,至少它是易于格式化的,而且客户也能够按照某种特定的格式来将数据录入到Excel文件中去。所以综上,我们有必要了解如何用纯java来读取Excel文件。
2. 目的
我们希望用户将资料录入Excel的目的往往只有一个就是将这些数据导入到数据库中去。数据库往往比较复杂,而且各种不同的数据库产品之间是不同的,这种区别无疑的增加了我们导入的困难。从excel文件来说,用户录入的数据往往并不能直接使用,要经过逻辑处理或者出错的判断,或者默认的改正等。如果能够使用java来直接读取excel文件,无疑会使我们能够较从容的解决这些问题。
3. 其他的方法
将数据从excel文件中读出来还有一个方法,就是使用odbc。然后再用jdbc-odbc桥来将数据从excel文件中读出到java中来,不过这种方法必须配odbc,针对excle文件配odbc是一件很麻烦的事情,而且难以操控,所以这只能是一种暂时的解决方法。
4. POI
POI是Apache的Jakata项目,POI 代表 Poor Obfuscation Implementation,即不良模糊化实现。POI 的目标就是提供一组 Java API 来使得基于 Microsoft OLE 2 Compound Document 格式的 Microsoft Office 文件易于操作。一些 POI API 仅仅是为最常用的 Microsoft Office 文件 Word 和 Excel 而开发的;而其他的 API 则是用于通用的 OLE 2 Compound Document 和属性文件。POI可以到www.apache.org下载到。编译好的jar主要有这样4个:poi包,poi Browser包,poi hdf包,poi hssf例程包。实际运行时,需要有poi包就可以了。POI 是一个开放源代码项目,并且得到了数百名志愿者的不断更新。可以在 http://jakarta.apache.org/builds/jakarta-poi/ 上获得源代码和文档。通过POI包,我们不仅可以操纵excel文档,也能够操控word文档,以及其他的OLE2格式的文档。
5. HSSF
HSSF 代表 Horrible Spreadsheet Format(可怕的电子表格格式)。API 给程序员提供了极其容易地读写或操作 Microsoft Excel 97-2002 文件的能力。这些API都由POI包来提供,实际使用是我们只需要POI包就可以了。
6. 操作EXCEL文件
HSSF提供给用户使用的对象在org.apache.poi.hssf.usermodel包中,主要部分包括Excell对象,样式和格式,还有辅助操作。有以下几种对象:
HSSFWorkbook excell的文档对象
HSSFSheet excell的表单
HSSFRow excell的行
HSSFCell excell的格子单元
HSSFFont excell字体
HSSFName 名称
HSSFDataFormat 日期格式
在poi1.7中才有以下2项:
HSSFHeader sheet头
HSSFFooter sheet尾
和这个样式
HSSFCellStyle cell样式
辅助操作包括
HSSFDateUtil 日期
HSSFPrintSetup 打印
HSSFErrorConstants 错误信息表
我们经常能够使用到的还是读取EXCEL文件,下面看一个例子:
POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream("workbook.xls")); HSSFWorkbook wb = new HSSFWorkbook(fs); HSSFSheet sheet = wb.getSheetAt(0); HSSFRow row = sheet.getRow(2); HSSFCell cell = row.getCell((short)3); if (cell == null) { cell = row.createCell((short)3); } cell.setCellType(HSSFCell.CELL_TYPE_STRING); cell.setCellValue("a test"); // Write the output to a file FileOutputStream fileOut = new FileOutputStream("workbook.xls"); wb.write(fileOut); fileOut.close();
这是基本的读写方法,其中我们注意到HSSF中几个关键对象的使用。其中HSSFWorkbook代表的是整个文档,这个workbook的概念是excel本身的概念,如果你不清楚,就去查excel的帮助文档。HSSFSheet代表的是具体的表格,在excel中一份workbook中可能会有好几个表格,这些表格的顺序是从0开始的。“HSSFSheet sheet = wb.getSheetAt(0);”这一条语句就是建立表格对象即Sheet对象。Sheet对象建立之后就可以读Cell了,即表格的内容。
通过POI来读取EXCEL文件就是这么简单。
7. 一个例子 这个例子是基于GUI的,功能是读入一个excel文件并输出成html或者文本文件(需要你自己选择)。并能够生成insert语句。要使用POI包。 package testxls;
import java.io.*; import javax.swing.*; import javax.swing.filechooser.FileFilter; import org.apache.poi.hssf.usermodel.*; import org.apache.poi.poifs.filesystem.*;
/** * <p>Title: 取得xls电子表格内容</p> * <p>Description: 这个类的作用是从微软的电子表格中读取信息, * 目前支持Excel97,Excel2000。使用apache的poi包。</p> * <p>Copyright: Copyright (c) 2003</p> * <p>Company: </p> * [email protected] * @version 1.0 */ public class testxls { File testfile = null; private HSSFSheet sheet; String Field = ""; String tbName="";
//-------------------------------------------------------- public testxls() { }
//------------------------------------------- public File filechooer() { //文件选择器
JFileChooser chooser = new JFileChooser();
XlsFileFiliter filter1 = new XlsFileFiliter();
chooser.addChoosableFileFilter(filter1); chooser.setAcceptAllFileFilterUsed(false); int result = chooser.showOpenDialog(chooser); testfile = chooser.getSelectedFile(); if (result == chooser.CANCEL_OPTION) System.exit(0); return testfile; }
//--------------------------------------------------- public HSSFSheet getSheet(File f) { //得到一个sheet对象。
HSSFWorkbook wb = null; POIFSFileSystem xlsf = null; try { xlsf = new POIFSFileSystem(new FileInputStream(f)); wb = new HSSFWorkbook(xlsf); } catch (IOException ex) { System.err.println("错误:文件流输入有误。"); ex.printStackTrace(); } HSSFSheet sheet = wb.getSheetAt(0); return sheet; }
//----------------------------------- public String[][] outresult() { int length[] = outresultlength(); String result[][] = new String[length[0]][length[1]];
int lastrow = sheet.getLastRowNum()+1; for (int i = 0; i < lastrow; i++) { HSSFRow row = sheet.getRow(i); int lastcell = row.getLastCellNum(); for (int j = 0; j < lastcell; j++) { HSSFCell cell = row.getCell( (short) j); if (cell == null) result[i][j] = "blank"; else { switch (cell.getCellType()) { case 1: result[i][j] = cell.getStringCellValue(); break; case 0: result[i][j] = cell.getNumericCellValue() + ""; break; case HSSFCell.CELL_TYPE_FORMULA: result[i][j] = cell.getCellFormula()+""; break; case 3: result[i][j] = "blank"; break; default: result[i][j] = "blank"; break; } } } } for (int i = 0; i < result.length; i++) { for (int j = 0; j < result[i].length; j++) { if (result[i][j] == null) { result[i][j] = "blank"; } } } return result; }
//-------------------------------------------------------------------------------- public int[] outresultlength() {
int lastrow = sheet.getLastRowNum()+1;//它是从零开始计算的。 HSSFRow row = sheet.getRow(0); int lastcell = row.getLastCellNum(); int a[] = { lastrow, lastcell}; return a; } //---------------------------------------------------------------------- public void printRs(String[][] rs) { for (int i = 0; i < rs.length; i++) { for (int j = 0; j < rs[i].length; j++) { System.out.print("(" + i + "," + j + ") " + rs[i][j] + " "); } System.out.println(" "); } }
//----------------------------------------------------------- public void outputXlsContent(String[][] xls) { String[][] content = xls;
JFileChooser chooser = new JFileChooser();
int result = chooser.showSaveDialog(chooser); File testfile1 = chooser.getSelectedFile(); if (result == chooser.CANCEL_OPTION) { System.exit(0); } try { DataOutputStream out = new DataOutputStream(new FileOutputStream( testfile1));
String fileName = testfile.getName(); String sql1 = fileName + "\n <table border=\"1\"> "; for (int i = 0; i < content.length; i++) { sql1 = sql1 + " <tr> "; for (int j = 0; j < content[i].length; j++) { sql1 = sql1 + " <td> " + content[i][j] + " </td> "; } sql1 = sql1 + " </tr> "; } sql1 = sql1 + " </table> "; byte[] b = sql1.getBytes("gbk"); out.write(b); out.close(); javax.swing.JOptionPane.showMessageDialog(null, "文件已经保存,按确定键退出!", "结束!", javax.swing.JOptionPane.INFORMATION_MESSAGE); } catch (Exception ex) { ex.printStackTrace(); } } //----------------------------------------------------------- public void outputXlsContent(String xls) { JFileChooser chooser = new JFileChooser();
int result = chooser.showSaveDialog(chooser); File testfile1 = chooser.getSelectedFile(); if (result == chooser.CANCEL_OPTION) { System.exit(0); } try { DataOutputStream out = new DataOutputStream(new FileOutputStream( testfile1));
String fileName = testfile.getName(); byte[] b = xls.getBytes("gbk"); out.write(b); out.close(); } catch (Exception ex) { ex.printStackTrace(); } } //-----------------------------------------------------------
public String generateinsertsql(String[][] content) {
String fieldContent=""; int ilength=0;
String sql=""; for (int i = 1; i < content.length; i++) { fieldContent="'"+content[i][0]+"'"; for(int j=1;j<content[i].length;j++) { fieldContent=fieldContent+",'"+content[i][j]+"'"; } sql=sql+"insert"+tbName+"("+Field+") values("+fieldContent+")\r\n"; ilength++; } System.out.print(sql); System.out.println("lenth of i:"+ilength); return sql;
}
//----------------------------------------------------------- public static void main(String[] args) { testxls testxls1 = new testxls(); testxls1.filechooer(); //testxls1.sheet= testxls1.getSheet(testxls1.filechooer()); //testxls1.generateinsertsql(testxls1.outresult()); //testxls1.outputXlsContent(testxls1.generateinsertsql(testxls1.outresult())); // System.exit(0); } }
文件过滤器类: package testxls;
/** * <p>Title: </p> * <p>Description: </p> * <p>Copyright: Copyright (c) 2004</p> * <p>Company: </p> * @author ClarkHillm@hotmailcom * @version 1.0 */
import java.io.*; import javax.swing.filechooser.FileFilter;
public class XlsFileFiliter extends javax.swing.filechooser.FileFilter { public String getFilePostfix(String FileName)//截取文件后缀。 { return FileName.substring(FileName.lastIndexOf(".")+1); } //-------------------------------------------------- public String getDescription() { return "电子表格文档"; }
//-------------------------------------------------- public boolean accept(File f) { String extension = "xls"; if (f.isDirectory()) { return true; } String name = f.getName(); if (getFilePostfix(name).equals(extension)) { return true; } else { return false; } } } 8. 结束 以上的对于POI的介绍只是很简单的引导大家入个门,如果大家感兴趣地话,可以自己参考POI的文档。

|