pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器

安装 pdftotext 到 RedHat / RHEL / Fedora / CentOS / Ubuntu

在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):

# yum install poppler-utils

或者在Debian / Ubuntu中使用如下指令:

$ sudo apt-get install poppler-utils

pdftotext 使用语法

pdftotext {PDF-file} {text-file}

如何将pdf转化为text?

将php-manual.pdf 转化为 php-manual.txt:

$ pdftotext php-manual.pdf php-manual.txt

只转化前 5 页和后 10 页:

$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt

转化加密过的pdf文件( owner password ):

$ pdftotext -opw ‘password‘ php-manual.pdf php-manual.txt

转化加密过的pdf文件( user password ):

$ pdftotext -upw ‘password‘ php-manual.pdf php-manual.txt

Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:

$ pdftotext -eol unix php-manual.pdf php-manual.txt

原作: http://www.icultivator.com/p/8744.html
时间: 2024-10-10 00:21:41

pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器的相关文章

linux shell assemble PDF文件

[email protected] ~/latex/linux/itext/daniel $ cat asm.sh header_start=0 header_len=15 xref_start=$(strings -a -t d $1 | grep -e "\bxref\b" | awk '{print $1}') trailer_start=$(strings -a -t d $1 | grep -e "\btrailer\b" | awk '{print $1

Linux/Unix下pid文件的作用

主要有三点: (1) pid文件的内容:pid文件为文本文件,内容只有一行, 记录了该进程的ID. 用cat命令可以看到. (2) pid文件的作用:防止进程启动多个副本.只有获得pid文件(固定路径固定文件名)写入权限(F_WRLCK)的进程才能正常启动并把自身的PID写入该文件中.其它同一个程序的多余进程则自动退出. (3) 编程技巧: 调用fcntl设置pid文件的锁定F_SETLK状态,其中锁定的标志位F_WRLCK. 如果成功锁定,则写入进程当前PID,进程继续往下执行. 如果锁定不成

PDF文件怎么转换成图片格式

随着PDF文件的广泛使用,我们在办公中,也会遇到PDF文件的处理.PDF文件格式稳定,无论对方使用的办公软件是WPS格式还是office格式,在接收过程中都不会发生变化.但是有时为了方便,需要把PDF文件转换成图片格式,那么,问题来了,PDF文件怎么转换成图片格式呢?下面一起来学习一下.分享工具:迅捷PDF转换器 下载链接:https://www.xunjiepdf.com/converter分享理由:转换质量高,功能丰富,是办公中必不可少的工具. 操作步骤:[步骤一]分享的工具可以到百度上面搜

PDF文件如何转换成DWG格式图纸?

PDF文件如何转换成DWG格式图纸?随着科技的发展,越来越多的格式文件也在不断地出现转换,PDF格式文件是现在人常常使用的一种格式文件对于从事CAD相关专业的人来说,那么如何将PDF格式图纸转换成DWG格式呢,应该如何进行此项操作,进行就来教教大家PDF文件如何转换成DWG格式图纸的全部操作步骤了,望采纳! 第一步:首先需要在电脑上安装一款CAD转换器的软件,小编在这里使用的就是这款"迅捷CAD转换器"的软件,有需要的可以去官网上进行下载!完成软件的安装之后进入软件,之后在软件左边界面

如何把pdf文件转化为doc格式文档

今天有一个群主发链接希望和自己电脑百事网做友情链接,小编看了一下对方站点,竟然竟然是一个单一的收费网站,主要是帮助用户将PDF文档转换成Word给,每转一次就要收10元的人工费,倘若是带水印或是加密的PDF转换成Word文档则收取50元.小编甚至觉得很奇怪,因为PDF转换成Word其实目前有很多软件,自己动动手就可以解决难道会有人买这个服务吗?于是马上与对方交流下,对方回复我说:网上新手太多,并不是什么都懂,遇到这种事并没有多多百度下,这也难怪他们了.的确如此,其实PDF转换成Word并不难,网

将PDF文件转换为word文档格式

平常编辑修改一些文档都是office类型的文档,但是随着PDF文件应用越来越广泛,在处理文档的时候遇见PDF也是很常见的虽然已经有PDF的编辑工具,但是对文档内容进行大范围的修改还是很不方便的,一般我们编辑文档都是用word来编写.即使是要支持PDF文档可以用word制作好以后在输出PDF格式,那么怎样把PDF文件转换成为word呢? 常用的办公文档之间的格式互相转换可以通过文档转换工具来实现,对于经常要处理各种文档的可以安装转换工具进行转换,如果只需要转换一些小文档,那么直接通过在线转换方式也

Linux学习汇总——Linux用户组管理,文件权限管理,文本处理工具grep及egrep

本章Blog相关Linux相关知识点 解析:在数据库按搜索码查找相对应的条目,并找与之对应额外的其他数据库的过程:名称解析:UID ,组名解析:GID 数据库:文本文件,sql数据库,ldap数据库,用户库:/etc/passwd ,密码库 :/etc/shadow,组库:/etc/group,组密码库:/etc/gshadow 加密方法:对称加密--加密和解密使用同一个密码,如DES,AES :公钥加密--每个密码都成对出现,一个公钥,一个私钥,如DSA,RSA:单向加密--常用于数据完整性校

Linux/Unix下pid文件作用浅析

转载:http://blog.csdn.net/changli_90/article/details/8911191 在Linux系统的目录/var/run下面一般我们都会看到很多的*.pid文件.而且往往新安装的程序在运行后也会在/var/run目录下面产生自己的pid文件.那么这些pid文件有什么作用呢?它的内容又是什么呢? (1) pid文件的内容:pid文件为文本文件,内容只有一行, 记录了该进程的ID. 用cat命令可以看到. (2) pid文件的作用:防止进程启动多个副本.只有获得p

Linux/Unix split 大文件分割合并

split 命令 功能说明:切割文件. 语 法:split [--help][--version][-<行数>][-b <字节>][-C <字节>][-l <行数>][要切割的文件][输出文件名] 补充说明:split可将文件切成较小的文件,预设每1000行会切成一个小文件. 参 数: -<行数>或-l<行数> 指定每多少行就要切成一个小文件. -b <字节> 指定每多少字就要切成一个小文件.支持单位:m,k -C <