【转】pdf文件自动切白边

pdf文件自动剪裁(自动切白边)

FROM:http://www.ai7.org/wp/html/754.html

可能用到的环境、工具:Ubuntu 10.04+TeXLive 2008+pdfcrop+CUPS打印驱动,用Windows的兄弟就不用看了,这些工具理论上在Windows下也有,但是还要另外装不少东西。

下面假设原文件(也就是打算切白边的文件)叫abc.pdf

  1. pdfcrop abc.pdf,默认会生成abc-crop.pdf文件,这个已经是切掉白边的了,要是你不嫌它大(或者它确实不大)的话,就完成了。
  2. 用阅读器(如evince)打开abc-crop.pdf,并通过CUPS打印到文件,打印时注意关闭所有和页面缩放有关的命令,并选中“使用文档的页面尺寸作为页面尺寸”。打印,完成。

说明:

  1. pdfcrop其实是TeXLive自带的。本质上是一个perl脚本。
  2. pdfcrop要调用gs(ghostscript)确定每页的白边大小。对于空白页,会报错,忽略即可。
  3. pdfcrop还可以在切的时候留若干像素,具体请–help。
  4. pdfcrop要调用pdftex以生成切白边后的文件。
  5. pdfcrop本质上(猜想,没有阅读源码)是先将abc.pdf展开成单页的pdf,调用gs切白边,再用tex文件直接调用pdf页面,最后用pdftex生成输出。
  6. pdfcrop直接生成的文件一般是原文件的20倍以上(本人测试的几个文件均是如此),虚拟打印到新的文件后,基本可以恢复到与原文件同样数量级的尺寸。
  7. 测试都是使用的内嵌字体的中英文PDF。扫描版的没试,估计够呛。

附一个类似的eps版工具

首先用下面的命令来去除白边。因为是程序来做的,去除白边的效果甚至比人自己做好:

epstool --copy --bbox input_file.eps input_file_temp.eps

第二步也是最后一步,将eps图像转成pdf,也只需要一行命令

epstopdf --hires --outfile=output.pdf input_file_temp.eps

这样就完成了eps到pdf的转换了。

上述的操作流程可以写成一个脚本

epstool --copy --bbox $1 my_epstopdf_temp.eps

epstopdf --hires --outfile=$2 my_epstopdf_temp.eps

rm my_epstopdf_temp.eps

时间: 2024-10-13 13:24:14

【转】pdf文件自动切白边的相关文章

Pdf文件怎么翻译,翻译pdf文件的两个好办法

Pdf文件怎么翻译,翻译pdf文件的两个好方法.现如今网络越来越发达,大家都会选择在网上查看需要的文件.资料.这时就会发现网上很多文件格式是以pdf格式上传的.Pdf文件格式阅读性好.安全性高,本应受到大家喜爱.可是由于它本身的封闭性,无法编辑修改.当遇到内容为英文的pdf文件时,在自身英文水平不好的情况下,不知道该如何翻译文件中的内容.接下来的文字内容当中小编就和大家讲讲如何翻译pdf文件. 使用工具:迅捷PDF转换器https://www.xunjiepdf.com/converter 1.

如何给PDF文件增加密码?PDF增加密码的简单方法

pdf文件中可以放很多在工作上需要用到的一些重要文件,那么我们是怎么进行在线将pdf文件添加密码的呢?下面就让小编给大家简单介绍一下. 步骤一:首先我们可以直接在浏览器上进行搜索迅捷PDF在线转换器,然后进入到在线网站中去:步骤二:在文档处理中找到PDF增加密码这个功能,然后我们就可以进行点击进入:步骤三:然后进行密码的输入,在输入栏中进行密码的输入,然后进行PDF文件的选择,点击选择文件进行文件的选择:步骤四:文件的选择可以是直接将PDF文件选择到界面中去,或是直接点击进行选择文件:步骤五:P

如何给PDF文件增加密码?

pdf文件中可以放很多在工作上需要用到的一些重要文件,那么我们是怎么进行在线将pdf文件添加密码的呢?下面就让小编给大家简单介绍一下.步骤一:首先我们可以直接在浏览器上进行搜索迅捷PDF在线转换器,然后进入到在线网站中去:步骤二:在文档处理中找到PDF增加密码这个功能,然后我们就可以进行点击进入:步骤三:然后进行密码的输入,在输入栏中进行密码的输入,然后进行PDF文件的选择,点击选择文件进行文件的选择:步骤四:文件的选择可以是直接将PDF文件选择到界面中去,或是直接点击进行选择文件:步骤五:PD

PDF文件添加二维码水印教程

maven配置iText的jar,主要不是所有私服都有iText的jar,maven仓库没有的,可以去https://mvnrepository.com/artifact/com.itextpdf/itextpdf/5.5.12 这里下载 <!-- itextpdf --> <dependency> <groupId>com.itextpdf</groupId> <artifactId>itextpdf</artifactId> &l

提取论文标题并自动重命名pdf文件

在我们确定一个研究课题之后,我们总是会先下载一堆相关的paper,看看这个领域现在已经做到一个什么地步,也看看别人是怎么做的,后面自己写paper的时候可以参考参考.当我们把相关的文章都下载到一个文件夹之后,有一个问题,一般我们从IEEE或是ACM相关站点下载的PDF文件的文件名不是相应文章的标题.我们希望文件名尽量能够反映文件的主要内容,文章的标题显然是最能概括文张内容的.昨天上午,一个小时的时间就花在把下载下来的文件重命名上了.因为太费时间,想自己写个简单的小程序来完成这个工作.上网一找,嗬

怎样自动将word转换成为PDF文件

有些word文档在编辑完成后会转换成一个pdf文件,用来传送给他人查看,这样既可以看不同系统上打开查看,也可以使文档不被随意修改.将word转换成pdf,不用复制粘贴或是重新制作pdf文件,那怎样自动将word转换成为PDF文件呢? 把word自动转换成pdf,先打开进入在线word转pdf工具,选择word转pdf选项. 点选择文件,将需要转换的word添加到在线转换工具,然后点开始转换,等文档处理完成后,直接下载转换好的pdf文件就可以了. 如果安装的是新版本的word编辑工具,例如offi

IE浏览器不能自动显示PDF文件的解决办法

今天更新了Adobe的PDF Reader,更新后发现在网页上无法预览PDF文件了,点击PDF的连接,浏览器就会提示下载或者打开,感觉很不爽,经过一番百度,找到了解决办法,在这里分享一下. 打开IE浏览器,在标题栏上面单击右键: 勾选Menu Bar,然后就会看到菜单栏显示出来了,点击Tool > Manage Add-nos,如图: 打开如下界面,点击下拉框,选中All add-ons 然后会显示所有的内容: 如图,选中PDF Reader,点击Disable按钮,按钮会变为Enable,然后

页面直接导出为PDF文件,支持分页与页边距

将WEB页面直接导出为pdf文件是经常会用到的一个功能,尤其是各种报表系统.总结了一下目前几种主流的做法: 在后端用代码生成pdf文件,比如iText一类: 在后端抓取页面并生成pdf文件,比如phantomjs一类: 在前端用js直接生成pdf文件: 方案3的优势在于前端直接生成,所见即所得.今天要探索的就是html2canvas和jspdf,前者用于将页面元素render生成canvas,后者用于将canvas生成pdf文档.需要注意的是,这种方法对IE系列支持不好. html2canvas

如何有效的对PDF文件进行加密保护

PDF是办公中保存资料数据文件不可或缺的一类电子文件工具软件,它的优势在于清晰的位图显示形式和良好的阅读体验,所以很多合同报告.电子书.技术文档.设计图纸等都越来越倾向这种存储方式.和普通的电子文档一样,如Word.Excel,PDF文件也存在信息安全泄漏风险,因此加密保护也是必不可少的.下面就来分享下如何对PDF进行权限设置和PDF文件加密操作. PDF格式的官方编辑器Adobe acrobat 软件为我们提供的口令加密包含"打开文档的口令"和"限制文档编辑打印口令&quo