APache PDFbox API使用(3)----如何得到一个带表单的PDF文件的表单结构

我们知道,在PDF文件中不但可以保存图片和文字,而且我们还可以在PDF文件里面建立表单。比如,下面的图1就是一个PDF文件里面建立了一些表单。

其实PDF文件是一个有特殊结构的文件,那么,如果我们需要通过PDFBox API去往这些表单上面填值的时候,我们需要知道这些表单在PDF文件里面是如何定义的,

名称是什么. 一般的情况下,我们直接用PDFBox的API,那么有没有另外一种更为简单的方法呢? 当然有,那就是http://support.persits.com/pdf/demo_formfields.asp

这个网站,可以在线解析我们的上传的PDF文件的表单的结构。咱们还是以图一的PDF文件为例子,利用图2的网站,查看一下当前PDF文件中表单的结构描述。

查询的结果,请见图3.

图1

图2

图3

时间: 2024-10-03 13:09:45

APache PDFbox API使用(3)----如何得到一个带表单的PDF文件的表单结构的相关文章

APache PDFbox API使用(1)----简介

由于项目的需要,最近在学习APache  PDFbox API,Apache PDFbox API是Apache Java 开源社区中个一个项目,其受Apache 版权 V2的保护,其提供了下面的功能: (1)文本的提取 即在PDF文件里面把文本内容提取出来. (2) 合并和拆分PDF文档 可以把几个PDF合并成一个PDF文件,也可以把一个PDF文件拆分成多个PDF文件. (3) 表单填充 从PDF文件的表单中提取数据或者写入数据到PDF表单中. (4) PDF/A的校验 根据PDF/A ISO

APache PDFbox API使用(2)----命令行工具的使用

在写具体代码之前,咱们先了解一下Apache PDFbox API框架给我们提供的命令行工具.通过这个命令行工具,我们可以了解大部分 Apache PDFbox给我们提供的强大功能. 在我们运行命令之前,我们首先需要去下载这个命令行工具所依赖的jar文件,大家可以去下面的任何一个站点去下载. http://apache.fayea.com/apache-mirror/pdfbox/1.8.5/pdfbox-app-1.8.5.jar http://mirrors.cnnic.cn/apache/

Apache PDFbox开发指南之PDF文档读取

转载请注明来源:http://blog.csdn.net/loongshawn/article/details/51542309 相关文章: <Apache PDFbox开发指南之PDF文本内容挖掘> < Apache PDFbox开发指南之PDF文档读取> 1.介绍 Apache PDFbox是一个开源的.基于Java的.支持PDF文档生成的工具库,它可以用于创建新的PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需的内容.Apache PDFBox还包含了数个命令行

关于Django中的数据库操作API之distinct去重的一个误传

关于Django中的数据库操作API之distinct去重的一个误传 最近在做一个Server的项目,后台框架是Apache mod_wsgi + django.django是一个基于Python的Web开发框架,功能十分强大,至于有多强大,还是读者们自己去体验吧.我在这里要说的一个问题是关于Python的ORM功能的.问题就在django提供的数据库操作API中的distinct()函数,了解SQL语句的读者都应该知道,DISTINCT关键字可以在select操作时去重.django里的这个d

利用Apache的beanutils判断字符串是否为一个合法日期

依赖的jar包 commons-beanutils-1.8.0.jar commons-logging-1.0.4.jar 方法如下 package test.date; import java.util.Date; import java.util.Locale; import org.apache.commons.beanutils.locale.converters.DateLocaleConverter; /**  * 利用Apache的beanutils判断字符串是否为一个合法日期  

[Java]Read Excel File Using Apache POI API

读取以下两种格式的Excel : *.xls  and *.xlsx 用Apache POI API来实现,需要用到 HSSF 和 XSSF 的类库 HSSF is the POI Project's pure Java implementation of the Excel '97(-2007) (.xls) file format. XSSF is the POI Project's pure Java implementation of the Excel 2007 OOXML (.xls

【百度地图API】发布静态图API啦!只需一个网址,即可展示定制百度地图!

原文:[百度地图API]发布静态图API啦!只需一个网址,即可展示定制百度地图! 摘要: 百度地图静态图API!您无须执行任何“特殊”操作便可在网页上显示此图片. 不需要 JavaScript.我们只需创建一个网址,并将其放入 <img> 标记中.即可将定制的百度地图图片嵌入到自己的网页中. ------------------------------------------------------------------------------------------------------

java使用pdfbox操作pdf文件

import java.io.FileInputStream; import org.apache.pdfbox.cos.COSDocument; import org.apache.pdfbox.pdfparser.PDFParser; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper; public class Read {  public String rea

一个lua5.3编译的nmake文件

lua官方的源码包里面的Makefile文件没有针对windows nmake工具的Makefile文件,但其官方给出的Makefile的书写很工整,很容易就模仿一个nmake版本的Makefile,文件我放到了这里. 把nmake版本的文件(Lua53.Makefile.nmake)放到lua源码的src目录,使用visual c++命令行切换到src目录,执行"nmake /f Makefile.nmake"命令就可以编译成功,使用"dumpbin /exports lu