注册 | 登录 忘记密码? 51cto首页 | 博客 | 论坛 | 招聘
热点文章 网工人才缺口大 传统网管..
 帮助

用Java读取word中的数据


2008-07-14 16:49:36
 标签:java   [推送到技术圈]

版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://weijie.blog.51cto.com/340746/87694
用Java简单的读取word文档中的数据:
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {

 public static String readDoc(String doc) throws Exception {
  // 创建输入流读取doc文件
  FileInputStream in = new FileInputStream(new File(doc));
  WordExtractor extractor = null;
  String text = null;
  // 创建WordExtractor
  extractor = new WordExtractor();
  // 对doc文件进行提取
  text = extractor.extractText(in);
  return text;
 }
 /**
  * @param args
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
        try{
         String text = WordReader.readDoc("E:/Strust.doc");
         System.out.println(text);
        }catch(Exception ex){
         ex.printStackTrace();
        }
 }
}
   
   这样就简单的完成了从word中读取数据了。你可以把它生成一个txt的文件。
 

本文出自 “魏杰的技术专栏” 博客,请务必保留此出处http://weijie.blog.51cto.com/340746/87694





    文章评论
 
2008-07-14 18:06:28
不错 记号。。。 有时间多多交流哦

2008-07-15 08:09:24
不错,简单实用。

 

发表评论

昵   称:
验证码:  点击图片可刷新验证码  博客过2级,无需填写验证码
内   容: