word2html文件

 1 package com.wesib2b.lw.app.util;
 2
 3 import java.io.ByteArrayOutputStream;
 4 import java.io.File;
 5 import java.io.FileInputStream;
 6 import java.io.FileNotFoundException;
 7 import java.io.FileOutputStream;
 8 import java.io.InputStream;
 9 import java.util.List;
10 import javax.xml.parsers.DocumentBuilderFactory;
11 import javax.xml.transform.OutputKeys;
12 import javax.xml.transform.Transformer;
13 import javax.xml.transform.TransformerFactory;
14 import javax.xml.transform.dom.DOMSource;
15 import javax.xml.transform.stream.StreamResult;
16 import org.apache.commons.io.FileUtils;
17 import org.apache.poi.hwpf.HWPFDocument;
18 import org.apache.poi.hwpf.converter.PicturesManager;
19 import org.apache.poi.hwpf.converter.WordToHtmlConverter;
20 import org.apache.poi.hwpf.usermodel.Picture;
21 import org.apache.poi.hwpf.usermodel.PictureType;
22 import org.w3c.dom.Document;
23
24 public class test {
25     public static void main(String[] args) throws Throwable {
26         final String path = "D:\\";
27         final String file = "59系统教师绩效统计(需求变更).doc";
28         InputStream input = new FileInputStream(path + file);
29         HWPFDocument wordDocument = new HWPFDocument(input);
30         WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
31                 DocumentBuilderFactory.newInstance().newDocumentBuilder()
32                         .newDocument());
33         wordToHtmlConverter.setPicturesManager(new PicturesManager() {
34             public String savePicture(byte[] content, PictureType pictureType,
35                     String suggestedName, float widthInches, float heightInches) {
36                 return suggestedName;
37             }
38         });
39         wordToHtmlConverter.processDocument(wordDocument);
40         List pics = wordDocument.getPicturesTable().getAllPictures();
41         if (pics != null) {
42             for (int i = 0; i < pics.size(); i++) {
43                 Picture pic = (Picture) pics.get(i);
44                 try {
45                     pic.writeImageContent(new FileOutputStream(path
46                             + pic.suggestFullFileName()));
47                 } catch (FileNotFoundException e) {
48                     e.printStackTrace();
49                 }
50             }
51         }
52         Document htmlDocument = wordToHtmlConverter.getDocument();
53         ByteArrayOutputStream outStream = new ByteArrayOutputStream();
54         DOMSource domSource = new DOMSource(htmlDocument);
55         StreamResult streamResult = new StreamResult(outStream);
56         TransformerFactory tf = TransformerFactory.newInstance();
57         Transformer serializer = tf.newTransformer();
58         serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
59         serializer.setOutputProperty(OutputKeys.INDENT, "yes");
60         serializer.setOutputProperty(OutputKeys.METHOD, "html");
61         serializer.transform(domSource, streamResult);
62         outStream.close();
63         String content = new String(outStream.toByteArray());
64         FileUtils.write(new File(path, "1.html"), content, "utf-8");
65     }
66 }
时间: 2024-10-09 12:39:50

word2html文件的相关文章

最佳vim技巧

最佳vim技巧----------------------------------------# 信息来源----------------------------------------www.vim.org         : 官方站点comp.editors        : 新闻组http://www.newriders.com/books/opl/ebooks/0735710015.html : Vim书籍http://vimdoc.sourceforge.net/cgi-bin/vim

在线浏览office 文件

http://blog.csdn.net/binyao02123202/article/details/20051683 [Asp.net]常见word,excel,ppt,pdf在线预览方案,有图有真相,总有一款适合你! 2014-02-27 15:04     1089人阅读     评论(0)     收藏     举报 目录(?)[+] 引言 方案一 方案二 方案三 方案四 方案五 方案六 总结 引言 之前项目需要,查找了office文档在线预览的解决方案,顺便记录一下,方便以后查询.

Mac下获取AppStore安装包文件路径

本文介绍了Mac下如何找到AppStore下载的安装包路径,以及如何提取出来供以后使用的相关步骤,希望对大家有所帮助. 通过远在大洋彼岸的苹果服务器下载东西,确实有够慢啊!AppStore更甚:甚至都经常提示连不上服务器,而有些软件呢,还必须从AppStore下载安装,所以没办法,谁让上了苹果的贼船呢!公司的网速更是不敢恭维,以至于基本上不下东西,除非像这次一样:手贱的把iPhone6升级到8.2.2了,然后Xcode6.1.1真机调试不成了,所以需要下个Xcode6.2.昨天刚更新的Xcode

微信文件传输助手文件夹在哪?一起来找找

微信文件传输助手是微信电脑版与手机微信之间相互传输图片等文件的好工具,但很多童鞋都找不到微信文件传输助手文件夹在哪,就让我们一起找找吧 1.先说说手机微信文件传输助手文件夹在哪吧 文件夹路径为/Tencent/MicroMsg/Download/ 2.电脑版微信文件传输助手文件夹在:/微信安装保存目录/wechat files/微信号/ 也可以点击接收到的图片下载保存到相应位置即可

GitHub限制上传大于100M的单个大文件

工作中遇到这个问题,一些美术资源..unitypackage文件大于100M,Push到GitHub时被拒绝.意思是Push到GitHub的每个文件的大小都要求小于100M. 搜了一下,很多解决办法只是把这些超过100M的大文件从本地版本库中移除,使得Push可以成功.但这并没有解决如何上传大文件到GitHub的问题. 解决办法是使用Git LFS. 用法参考:http://blog.csdn.net/tyro_java/article/details/53440666 按照以上方法设置好后,就

Linux 将文件夹下的所有文件复制到另一个文件里

如何将文件夹/home/work下的文件复制到/home/temp里面? 使用命令: cp -R /home/work/* /home/temp *表示所有文件 但是/home/work 下的隐藏文件都不会被拷贝 更好的复制的方法是用"."代替"*"就好了. cp -R /home/work/.  /home/temp 将一个文件夹复制到另一个文件夹下,例如将/home下的work文件夹复制到temp下面 命令为: cp -R /home/work  /home/t

Maven中,pom.xml文件报错

一:错误消息,如下图: aus 原因是本地仓库在org.codehaus.plexus:plexus-uils:pom:3.0.20下面没有jar文件,只有一个plexus-utils-3.0.20.pom.lastUpdated,如下图: 解决:将该文件夹删掉,然后右击项目:Maven->Update Project就可以了 若pom.xml里面还有类型的报错,就像这样解决就OK了

java读文件

java.io.*; public abstract class Reader implements Readable,Closeable{}     public class BufferedReader extends Reader{         public BufferedReader(Reader in);创建一个使用默认大小输入缓冲区的缓冲字符输入流.         public BufferedReader(Reader in, int sz);创建一个使用指定大小输入缓冲区

PHP拷贝目录下的所有文件

//目录拷贝函数到任意目录function dir1($filename,$dest){ static $dirname; $dirname.=$dest; //连接头(第一层目录) static $dir; //中间变量 if(file_exists($filename)){ //如果文件存在 if(is_dir($filename)){ //如果是目录,则先创建目录然后遍历 $dirnames=basename($filename); //取最后的目录或者文件名,链接到要转移到的第一层目录