实例讲解Java读取一般文本文件和word文档的方法
一般文本文件
我们以日志文件.log文件为例:
importjava.io.BufferedReader; importjava.io.File; importjava.io.FileInputStream; importjava.io.FileNotFoundException; importjava.io.FileReader; importjava.io.IOException; publicclassFile_Test{ /** *@paramargs */ publicstaticvoidmain(String[]args){ Filefile=newFile("D:\\logserrorMsg.log"); if(file.exists()){ System.out.println("此文件存在"); }else{ System.out.println("此文件不存在"); } try{ FileReaderfr=newFileReader(file); BufferedReaderbr=newBufferedReader(fr); Strings; while((s=br.readLine())!=null){ System.out.println(s); } System.out.println("文件大小为(MB):"+newFileInputStream(file).available()/1024/1024+"M"); }catch(FileNotFoundExceptione){ e.printStackTrace(); }catch(IOExceptione){ e.printStackTrace(); } } }
.doc文件
这里我们使用WordExtractor读取Word文档,WordExtractor来自于Apache的poi类库项目,官方下载地址:https://poi.apache.org/download.html
importjava.io.FileInputStream; importorg.textmining.text.extraction.WordExtractor; publicclassWordTest{ publicstaticvoidmain(Stringargs[])throwsException{ newWordTest().readByOther(); } publicvoidreadByText()throwsException{ FileInputStreamin=newFileInputStream("C://test.doc"); WordExtractorextractor=newWordExtractor(); Stringstr=extractor.extractText(in); System.out.println(str); } }