java 处理word文档 (含图片,表格内容)

由于本人长期从事Oa相关项目的开发,所以处理word文档,Pdf,Excel等是在所难免的。

1.需求      处理Excel 可以用jxl        或者poi

2需求     用户在系统上填写信息,保存后导出标准的word文档,用户在系统上填写的信息我们用富文本编辑工具kindEditor,这个插件可以将用户从word文档拷贝的表格标签保存,但是图片信息需要另行上传。 现在问题出来了,我们要将这些包含图片,表格,特殊符号的东东生成word文档。

如果是单纯的没有特殊格字符,图片等信息,如果要生成word文档的时候可以用java+Freemark 模版的做法,具体作法

用word编辑好模版,将模版另存为 office 2003 xml 格式,然后打上相应的标签,最后将模版后缀改为.ftl即freemarker模版后缀即可。

如果有内容中有图片,而且图片位置不固定,这样是需要用java + velocity 模版的做法,具体流程将编辑好的word模版另存为.mht即单网页文档。

最后调整后缀为.vm即可。但是这个处理过程图片是保存不了的, 这个需要配合java2word。利用java+velocity 生成word文档,在往文档里面插入内容的时候可以用正则表达式替换图片标签为特殊的字符串,等到文档声称完毕后,采用java2word工具里面的查找替换功能将图片插入咱们内容加入的特殊字符位置。

如果想要效果标准的word文档,可以用itext 我用的是itext 2.1.7 一共三个包,其中一个是亚洲包,这个是支持中文的,利用litext可以用代码画出标准的word文档,特别是对待分页以及表格格式要求严格的用户。

上面说的java + velocity是临时方案,其实最简单的解决富文本编辑的问题时用插件,我们为客户购买了千航 即NTKO的office 编辑插件,我们买的是跨平台版的,这个插件可以

让用户在线编辑word文档并将文档保存到数据库。但是用这个插件可能系统运行初期,需要花费很大精力去运维,因为用户电脑的环境不是咱们开发人员能够左右的,等到一个周期过去之后效果基本上会好起来。

java 处理word文档 (含图片,表格内容),布布扣,bubuko.com

时间: 2024-10-09 20:15:02

java 处理word文档 (含图片,表格内容)的相关文章

python读取word文档中的表格内容

import docx fn = r'D:\长恨歌.docx' doc = docx.Document(fn) # 按段落读取全部数据 for paragraph in doc.paragraphs: print(paragraph.text) # 按表格读取全部数据 for table in doc.tables: for row in table.rows: for cell in row.cells: print(cell.text) table_num = len(doc.tables)

使用Java POI来选择提取Word文档中的表格信息

通过使用Java POI来提取Word(1992)文档中的表格信息,其中POI支持不同的ms文档类型,在具体操作中需要注意.本文主要是通过POI来提取微软2003文档中的表格信息,具体code如下(事先需要导入POI的jar包): public static void testWord2() { try { FileInputStream in = new FileInputStream("july 2005 1.doc");// 载入文档 // FileInputStream in

Java读取word文档解决方案

java读取word文档时,虽然网上介绍了很多插件poi.java2Word.jacob.itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用):java2Word.jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄:itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法.经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,

java 在MySQL中存储文件,读取文件(包括图片,word文档,excel表格,ppt,zip文件等)

转自:https://blog.csdn.net/u014475796/article/details/49893261 在设计到数据库的开发中,难免要将图片或文档文件(如word)插入到数据库中的情况.一般来说,我们可以通过插入文件相应的存储路径,而不是文件本身,来避免直接向数据库里插入的麻烦.但有些时候,直接向MySQL中插入文件,更加安全,而且更加容易管理. 首先,先要在数据库中建表.我在名为test的数据库下建立了一个叫pic的表.该表包括3列,id, caption和img.其中id是

向Docx4j生成的word文档添加图片和布局--第一部分

原文标题:Adding images and layout to your Docx4j-generated word documents, part 1 原文链接:http://blog.iprofs.nl/2012/10/22/adding-images-and-layout-to-your-docx4j-generated-word-documents-part-1/ 原文作者:lvdpal 发表日期:2012年10月22日 注:由于我对docx4j也不是很熟悉,所以很多专业名词不会翻译,

Java 将Word文档转换为PDF

前言 本文将介绍如何使用免费Java Word组件Free Spire.Doc for Java在Java应用程序中将Word文档转换到PDF格式.Free Spire.Doc for Java在转换过程中能够识别中文字符并支持丰富的word文档元素:文本框.页眉.页脚.项目符号和编号.表格.文本.超链接.水印.图片.形状等. Free Spire.Doc for Java概述 Free Spire.Doc for Java 是由E-iceblue公司开发的一个免费的Java Word API,

Struts2利用iText导出word文档(包含表格)以提供下载

J2EE ExcelStrutsXML 在公司实习期间,带我的老师让我实现一功能——在显示课表的页面上上点击“导出文件“时能以word文档形式下载课表.将课表导出到excel里的功能他们已经实现了,用的是Struts2+poi实现的.poi对excel表格操作能力很强,但是对word文档的支持一直没有更新,操作能力有限. iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库.通过iText不仅可以生成PDF或rtf 的文档,而且可以将XML.Ht

[原创]java读写word文档,完美解决方案

做项目的过程中,经常需要把数据里里的数据读出来,经过加工,以word格式输出. 在网上找了很多解决方案都不太理想,偶尔发现了PageOffice,一个国产的Office插件,开发调用非常简单!比网上介绍的poi,jacob等解决方按容易上手多了!功能接口虽然没有poi,jacob那么多,但是满足了一般的需求的百分之八九十,而且不像poi那样还需要区分处理07格式和03格式那么麻烦. 下面是百度百科PageOffice的介绍: https://baike.baidu.com/item/PageOf

[转载]java读写word文档,完美解决方案

做项目的过程中,经常需要把数据里里的数据读出来,经过加工,以word格式输出. 在网上找了很多解决方案都不太理想,偶尔发现了PageOffice,一个国产的Office插件,开发调用非常简单!比网上介绍的poi,jacob等解决方按容易上手多了!功能接口虽然没有poi,jacob那么多,但是满足了一般的需求的百分之八九十,而且不像poi那样还需要区分处理07格式和03格式那么麻烦. 下面是百度百科PageOffice的介绍: https://baike.baidu.com/item/PageOf