http://www.csdn.net/Develop/Read_Article.asp?Id=17710,对于任意文件都可以

解决方案 »

  1.   

    我觉得不可行。因为word有自己的格式。前多少位或者哪些位数装载的是word的标志。直接将几个word硬拼到一起,得到的内容或者会比原来多些不知所谓的东西,或者根本打不开
      

  2.   

    happyegg(快乐蛋) 你的说法是对的。
    我当然已经试过了 ytdmm(相忘于江湖) 所说的。
     后来查了资料,WORD  和excel是加了密的文件格式,
    在JAVA中是没有办法把多个文件合并的。
    但是据说有些控件可以做到,所以发帖想看看有没有人用过。
      

  3.   

    byte[] b=new byte[1024];
      int read=0;
      FileOutputStream fos=new FileOutputStream(savefile);
      FileInputStream fis;
      File[] f=file.getParentFile().listFiles();
      for(int i=0;i<f.length;i++) {
        if(!f[i].getName().startsWith(selfilename))continue;
        fis=new FileInputStream(f[i]);
        while((read=fis.read(b,0,b.length))>0) {
          fos.write(b, 0, read);
          fos.flush();
        }
        fis.close();
      }
      fos.close();
      fos=null;
      fis=null;
    对word文件,这种方法我是试过了的,真的不行啦!
      

  4.   

    2. 用apache的poi来抽取word,excel。
    poi是apache的一个项目,不过就算用poi你可能都觉得很烦,不过不要紧,这里提供了更加简单的一个接口给你: 下载经过封装后的poi包: http://www.matrix.org.cn/down_view.asp?id=14 下载之后,放到你的classpath就可以了,下面是如何使用它的一个例子: 
    import java.io.*;
    import  org.textmining.text.extraction.WordExtractor;
    /**
     * <p>Title: word extraction</p>
     * <p>Description: email:[email protected]</p>
     * <p>Copyright: Matrix Copyright (c) 2003</p>
     * <p>Company: Matrix.org.cn</p>
     * @author chris
     * @version 1.0,who use this example pls remain the declare
     */public class PdfExtractor {
      public PdfExtractor() {
      }
      public static void main(String args[]) throws Exception
      {
      FileInputStream in = new FileInputStream ("c:\\a.doc");
      WordExtractor extractor = new WordExtractor();
      String str = extractor.extractText(in);
      System.out.println("the result length is"+str.length());
       System.out.println("the result is"+str);
    }
      

  5.   

    forqzy(forqzy) 多谢你。 我先试一下!
      

  6.   

    forqzy(forqzy) 很遗憾,你给我的接口功能太少了,我的WORD文件中有好多的图片。如果是把多个文件可以直接写到另一个文件中就好了。 因为有图片的存在,转换成String后,图片都没了,但是我的图片是很重要的。