Java使用Apache POI库读取Excel表格文档的示例
ApachePOI是用Java编写的免费开源的跨平台的JavaAPI,ApachePOI提供API给Java程式对MicrosoftOffice格式档案读和写的功能。
项目下载页:http://poi.apache.org/download.html
ApachePOI是创建和维护操作各种符合OfficeOpenXML(OOXML)标准和微软的OLE2复合文档格式(OLE2)的JavaAPI。用它可以使用Java读取和创建,修改MSExcel文件.而且,还可以使用Java读取和创建MSWord和MSPowerPoint文件。ApachePOI提供Java操作Excel解决方案。
- HSSF-提供读写MicrosoftExcelXLS格式档案的功能。
- XSSF-提供读写MicrosoftExcelOOXMLXLSX格式档案的功能。
- HWPF-提供读写MicrosoftWordDOC格式档案的功能。
- HSLF-提供读写MicrosoftPowerPoint格式档案的功能。
- HDGF-提供读MicrosoftVisio格式档案的功能。
- HPBF-提供读MicrosoftPublisher格式档案的功能。
- HSMF-提供读MicrosoftOutlook格式档案的功能。
读取Excel文档示例
我们使用POI中的HSSFWorkbook来读取Excel数据。
publicvoidtest(Filefile)throwsIOException{
InputStreaminp=newFileInputStream(file);
HSSFWorkbookworkbook=newHSSFWorkbook(inp);
//workbook...遍历操作
}
上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“ThesupplieddataappearstobeintheOffice2007+XML.YouarecallingthepartofPOIthatdealswithOLE2OfficeDocuments.YouneedtocalladifferentpartofPOItoprocessthisdata(egXSSFinsteadofHSSF)”
查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:
publicvoidtest(Filefile)throwsIOException{
InputStreaminp=newFileInputStream(file);
XSSFWorkbookworkbook=newXSSFWorkbook(inp);
//workbook...遍历操作
}
注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。
这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。
所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。
我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。
最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:
Workbookwb=WorkbookFactory.create(is);
可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:
/**
*CreatestheappropriateHSSFWorkbook/XSSFWorkbookfrom
*thegivenInputStream.
*YourinputstreamMUSTeithersupportmark/reset,or
*bewrappedasa{@linkPushbackInputStream}!
*/
publicstaticWorkbookcreate(InputStreaminp)throwsIOException,InvalidFormatException{
//Ifclearlydoesn'tdomark/reset,wrapup
if(!inp.markSupported()){
inp=newPushbackInputStream(inp,8);
}
if(POIFSFileSystem.hasPOIFSHeader(inp)){
returnnewHSSFWorkbook(inp);
}
if(POIXMLDocument.hasOOXMLHeader(inp)){
returnnewXSSFWorkbook(OPCPackage.open(inp));
}
thrownewIllegalArgumentException("YourInputStreamwasneitheranOLE2stream,noranOOXMLstream");
}
可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过。