Word格式转化为Html

package com.wiseweb.util;

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

public class WordtoHtml {

	//------------------------------------------------------------------------------
	//方法原型: change(String paths)
	//功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
	//输入参数: String
	//输出参数: 无
	//返 回 值: 无
	//其它说明: 递归
	//------------------------------------------------------------------------------
	  public static boolean change (String FolderPath,String FileName){

	        String FileFormat = "";
	        System.out.println(FolderPath);
	        FileFormat = FileName.substring(FileName.length()-4,FileName.length());
	        System.out.println(FileFormat);

	        if(FileFormat.equalsIgnoreCase(".doc"))
	        {
	            String DocFile = FolderPath +"//"+ FileName;

	            System.out.println("word文件路径:"+DocFile);
	            //word文件的完整路径

	            String HtmlFile = DocFile.substring(0, (DocFile.length() - 4)) + ".html";

	            System.out.println("htm文件路径:"+HtmlFile);
	            //html文件的完整路径

	            ActiveXComponent app = new ActiveXComponent("Word.Application");
	            //启动word

	            try
	            {
	                app.setProperty("Visible", new Variant(false));
	                //设置word程序非可视化运行

	                Dispatch docs = app.getProperty("Documents").toDispatch();

	                Dispatch doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{DocFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
	                //打开word文件

	                Dispatch.invoke(doc,"SaveAs",Dispatch.Method, new Object[]{HtmlFile,new Variant(8)}, new int[1]);
	                //作为htm格式保存文件

	                Dispatch.call(doc, "Close",new Variant(false));
	                //关闭文件

	            }
	            catch (Exception e)
	            {
	                e.printStackTrace();
	            }
	            finally
	            {
	                app.invoke("Quit", new Variant[] {});
	                //退出word程序
	            }
	            //转化完毕
	            return true;
	        }
	        return false;
	    }

	//------------------------------------------------------------------------------
	//方法原型: main(String[] args)
	//功能描述: main文件
	//输入参数: 无
	//输出参数: 无
	//返 回 值: 无
	//其它说明: 无
	//------------------------------------------------------------------------------
	 public static void main(String[] args)
	 {

//	  String paths = new String("E://wordToHtml");
	  String paths = new String("E:");
//	  String filename = "a.doc";
	  String filename = "servlet和jsp学习指南(Budi kurniawan).doc";

	  change(paths, filename);

	 }

}

其实原理就是利用word把文档打开,然后另存为html格式就ok了。

时间: 2024-08-01 23:40:35

Word格式转化为Html的相关文章

ppt转化为word格式 方法分享

对于ppt如何转换成word格式,大家可以还停留在复制粘贴,但现在已经有了更好的解决ppt文件转换的方法,可以更轻松的帮助我们完成格式转换,下面就来看看怎样更简单的将ppt转换成word吧. 先大概讲一下复制粘贴的方法,打开ppt文档,选中要转换的部分,右击复制: 打开word文档将复制好的内容粘贴进去(这样重复多次ppt文件就能转换好,是不是觉得很麻烦呢?) 下面的方法就厉害了,不仅操作简单,还能批量转换:先准备迅捷pdf转换软件: 打开安装好的转换器,选转换格式“文件转word”: 将要转的

程序源代码复制到word格式不变

程序源代码复制到word格式不变 将编程环境中带格式源代码复制到notepad++中,然后如图所示 选择NppExport中的Export to RTF ,将源代码导入到RTF文件中保存,再将RTF文件中的源代码赋值到Word中,这样就OK了.

Json格式转化为string格式

今天在学习Jsonp的时候,想通过服务端返回一段json数据,因为使用的服务端是NodeJs,那么就需要在js文件中实现返回json.(这里不懂的同学,可以先了解一下NodeJs的基础概念,在这里,我想大家推荐一个Nodejs视频  http://www.icoolxue.com/album/show/89). 首先,我们有这样一个json格式 var json={name:"xlt",age:25} 如果我们直接把上面这个”json对象“返回给客户端,那么客户端都不知道怎么接受(至于

支持在线Word格式转PDF文本的转换器

找一个好的PDF转换器就是在节省自己的时间.相信大家都有过这样的经验:好不容易找到了一些好点的 资料,但却基于格式的问题而停滞不前.因为普通的办公软件,如office就是打不开PDF文件的.这时候 我们需要的就是一个比较好用的PDF在线转Word转换器了. 由于我们经常需要转换的PDF文件内容并不相同,而不同的PDF文件内容对于不同的PDF识别技术将造成巨 大的困难,因此如何将PDF有效地进行转换,成为目前大部分用户关注的问题之一. 下面主要介绍迅捷PDF转Word转换器的特色功能. 灵活多样的

将markdown格式转化为bootstrap风格html

前言:这些年markdown格式的文件很流行,像github里project说明文档都是用markdown格式编写. 一方面,我们能够通过pandoc将markdown文件转换为html,这样将html文件放到自己的server上就能够解释了.安装pandoc见我的GitHub链接. 还有一方面,bootstrap是近年来一个比較好的web前端框架,那么我们希望将markdown文件转换为bootstrap风格的html文件.已经有人做过这个模块markdown2bootstrap. 1. 安装

在WindowsLiveWriter中保持Word格式粘贴

在WindowsLiveWriter中保持Word格式粘贴 平常在写博客的时候一般为先写到Word中并调整好格式,然后Ctrl+A与Ctrl+V到WindowsLiveWriter中,但是格式就全部变成简介版了,大部分格式都丢了,网络上有一句话叫"你不理财,财不理你"我也在这里引用一下,那就是你不理格式,格式不理你: 在Word中完成了内容与格式的编辑后,Ctrl+A,到WindowsLiveWriter中点击右键,选择"选择性粘贴>保留格式"这样Word中的

PDF转换为WORD格式

下载转换软件 添加文件 转换成功 PDF转换为WORD格式

通用的PDF转为Word格式的方法

PDF格式良好的视觉阅读性和通用性使得PDF文件的使用越来越广泛了,网络上的PDF资料也不少,但是我们常常希望可以对某些PDF资料里面的部分文字内容进行二次编辑,那么我们这里就是讲比较通用的PDF转为Word格式的方法. 使用迅捷PDF转换器: 首先,如果PDF是加密的,所以如果遇到已加密的PDF文件要先解密以后才可以转换的.这时你可以用pdf转换成word转换器,在项目栏选择PDF解密,添加需要转换的PDF文件,先将文件进行解密. 其次,怎么将PDF转换成Word.双击打开软件,进入操作界面,

pdf内容如何转换成word格式

PDF如何转成Word?PDF.Excel和Word格式文件是我们日常办公中使用频率最多的文本格式,很多时候我们需要把PDF转换成为更加方便打印编辑的Word和Excel文档,此时我们可以借助一些转换格式的软件来辅助我们完成转换工作. 迅捷pdf转换成word转换器是国内一个官方授权的格式转换工具,它可以将PDF转换成Microsoft Word格式,并且保留所有原始PDF格式及内容,转换成Excel格式后就可以编辑Word了.有需要的盆友可以尝试下载安装. 软件除了具备PDF转Word功能外,