转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/43527755
我们从网上下载的PDF文件有的是加密处理过的,无法复制其中的内容,对于这类文件的内容提取可以通过该工具实现
PDF加密
PDF文件经过加密处理之后是无法简单的复制的,PDF文件的属性也如下图所示:
工具的使用方法
软件的目录结构如下图:
lib文件夹下是程序的运行环境和代码;
pdf文件夹是需要转化的pdf文件所在的文件夹;
txt文件夹是转化后生成的txt文件所在的文件夹;
run.bat是运行文件。
将要转换的pdf文件放到pdf文件夹下,直接双击run.bat文件即可(ps:程序是后台运行,会花费一定的时间)
测试运行结果
如有需要,在评论中留下邮箱即可(原本想放到资源上的,无奈有大小限制,只得放弃)
源代码不大,主要是有代码运行的JDK环境,不放环境,电脑没安装JDK就无法使用,等个人域名备案成功之后,会将该程序放到自己的网站上。
无jdk的下载地址:http://download.csdn.net/detail/xiaojimanman/8426309 (下载后需要电脑安装1.7及以上的jdk)
时间: 2024-10-01 07:16:53