一、问题的提出:
一本书扫描好,要将书中的图片转换为文字版的word文档。
二、问题的分析:
1.文字的提取
2.文字的编排
三、问题的解决
1.如果用的是Adobe Acrobat 8 Professional
那么,扫描好的pdf文档,选定某一页,
文档→OCR文本识别→使用OCR识别文本
弹出识别文本对话框,注意要选择好识别的主要语言
在弹出的对话框中有个编辑按钮,点击“编辑”
弹出一个新的对话框窗体,将OCR识别的主要语言选择为简体中文,
然后确定后退出,在识别文本对话框中选择当前页面进行文本识别
软件自动将该页的图片进行方位校正,然后生成文本附在图片上
只要按下文本选择的图标,在图片上的文字上拉拽,就可选定文字。
选定好文字复制到文本文件中,可以发现识别生成的文字、标点是
每行都隔断好的,但文字和标点有零星的地方是识别错误生成另外的字符,
需要人工校正,在文本文件中校正好后,复制到word文档中。
如果用的是Adobe Acrobat XI Professional中文版
那么,扫描好的pdf文档,右上的菜单导航里有个工具两字
点击一下相关的工具菜单就整列出来,
这列工具菜单里有个文本识别,点一下
可以看到 在本文件中、在多个文件中这两个分支项目
点在本文件中,可以弹出和Adobe Acrobat 8 Professional一样的
识别文本窗口,默认设置是中文(简体),这就不用改了
识别方式和Adobe Acrobat 8 Professional一样。
2.word文档要调整成和原来扫描书籍中的格式,需要进行格式匹配,
比如标题的字体大小、字体类型,行间距、段落前后间距,页面纸张的大
小,一般要经过三页的调整才能定型好整体的格式。
3.注意在word文档中,进行段落属性的设置,
段落对话框中有个中文版式,记得更改为只打钩一个换行的第一个选项
就是按中文习惯控制首尾字符,其他都不选。
4.可以注意到其实印刷的书中每行的字数有个别与word文档编辑时每行
的字数对不上,要么多要么少,那么,就需要选定行进行文字属性的更改。
如果编辑时的文字,原来一行的文字符号变成两行,就选定好这些数量的文字
符号,右键选择字体,在弹出的字体对话框中选择高级选项卡,字符间距选择
紧缩,按照实际进行磅数的调整,一般是0.1磅就可以调整到位,个别要0.2磅
或者0.3磅,同理原来一行的文字符号吸纳了下一行的文字符号,则字符间距
选择加宽,把下一行的文字符号挤出这一行,一般也是0.1磅就可以调整到位,
个别要0.2磅或者0.3磅。
5.利用pdf打印机打出不同页面尺寸的书籍pdf文档
一般小本的书籍的尺寸在word文档的纸张大小是
32开(13×18.4 厘米) 即宽度为13厘米,高度18.4厘米
那么在编辑word文档的时候就要在页面设置里把纸张大小设为32开
对应的页边距也要调整好,和原纸书籍一致,比如
上:1.5厘米,下1.5厘米
左:1.3厘米,右1.3厘米
装订线:0厘米
pdf打印机属性里是没有32开纸张类型,要自行添加设定
Adobe PDF文档属性窗口中的Adobe PDF设置
在Adobe PDF页面大小,点添加,自行定义增加纸张类型。
使用word和pdf进行仿书编辑的经验
时间: 2024-10-18 15:45:09
使用word和pdf进行仿书编辑的经验的相关文章
pdf转换成可编辑的word转换器
头条号:近期有不少网友向我咨询有关PDF转换成可编辑的Word文档的软件,小Q认为网上虽然有很多类似的PDF转换成Word转换器,但是从性能以及转换效果来看,迅捷PDF转换成Word转换器免费版v6.0算是比较理想的选择,有需要的童鞋不妨尝试看看. pdf转换成word转换器是一款专业的PDF转Word工具软件,它能快速准确的将您PDF文档中的文字及图片提取出来,转换保存成Word格式,同时很好的让原有PDF中的文字/字体/大小/行间距等保持不变,图片也按照原始的排版布局还原,最大程度的还原原始
pdf文档的编辑技巧
PDF文档的编辑技巧 现如今PDF文档的应用范围越来越广了,在很多领域甚至PDF格式已经取代了Word文档,成为重要的文档格式.很多人都会觉得PDF格式的文档只能进行阅读了,对于里面的内容我们既不能复制也不能进行修改编辑.为了解决这个问题,各国的专业技术人员都在攻克这个问题,最终PDF编辑器也因此而诞生了. 有了PDF编辑器,我们就能对PDF文档进行修改了,大大的方便了我们的工作和学习.现在国内外的PDF编辑器比较多,但其中大多数都是收费的,而且软件内存比较大,运行起来也对电脑配置要求高.今天就
PDF的文字怎么编辑修改
一般word文档直接打开就可以编辑里面的文字内容,而pdf文件平时我们查看时都是用阅读器打开的,对里面的内容修改编辑不了,如果遇到pdf文件内容需要编辑修改时那又该怎么办呢. 用pdf编辑器打开文档,如果pdf文件是加密的在打开时会提示需要输入密码,如果不输入密码直接打开文档我们会发现整个页面内容是一张图片,不能对里面的文字进行修改的,所以加密的文档需要在打开时输入密码才可以编辑. 要修改文字先在页面缩略图中选择对应的编辑页面,在编辑区可以对当前的页面内容进行编辑. 页面中的文字可以在文字所在的
PDF格式文件怎样编辑修改
PDF现在是一种很流行的便携文档,但是在编辑上却不那么方便,所以有些人会将PDF文件转换成为word文档后再进行编辑修改,但是如果不想改变文件格式,直接对PDF进行编辑的话,那要怎么在PDF文件上编辑修改呢? 先用PDF编辑工具打开PDF文件,文档打开后可以通过左边的页面缩略图来切换当前的编辑页面,编辑文本内容的话直接用鼠标点击需要编辑的地方,就会出现一个方框,也就是文本框,在这个框内把光标移到需要编辑的位置,编辑输入文字即可. ? 在新的位置添加文本可以直接将文字复制粘贴到当前页面中,或者是用
Word怎么转成pdf格式,word转pdf的小技巧
Word怎么转成pdf格式?word是职场办公中较多使用得文件编辑工具,而pdf文件格式则是职场办公当中文件保存.文件阅读.打印的首选.因此在工作当中就经常会与遇到,使用word制作好文件后,需要转换为pdf格式进行保存.有很多刚刚入职的职场新人,对有关pdf文件格式转换并不是很了解,毕竟在此之前他们很少接触pdf文件.今天小编就将教给大家如何将word文件转换为pdf格式,word转pdf的小技巧. 1.刚接触pdf文件的小伙伴,可能还不知道pdf文件的特性.那就是文件本身打开无法进行编辑修改
PDF怎么转换成Word,PDF转Word的方法
在平时的工作生活中,很多人喜欢下载一些文章.资料之类的文件,但是下载下来往往都是PDF格式的,不太方便编辑处理.所以我们需要将PDF转换成可编辑的Word文档格式,但是该如何转换呢?下面就来介绍一下转换方法.1.先打开手机,在手机上先下载一个PDF转换大师,可借助这个工具将PDF转换成Word文档格式.2.打开工具,可以看到工具上面有两种转换文档格式的功能,点击功能--PDF转其他格式, 3.然后添加需要转换的PDF文件,在"全部文件"中可查看手机里保存的PDF文件. 4.再点击&qu
如何批量把Word转PDF,Word转换PDF如何在线转换
随着PDF文件的流行,大多数的公司存放文件和资料都已习惯性的用PDF格式,毕竟PDF文件的不可编辑性以及其保密性深受大家喜欢,今天就来跟大家分享一下如何批量将word文件转换成PDF文件.操作步骤:第一步:打开电脑,进入浏览器,在百度首页搜索迅捷PDF在线转换器.第二步:进入转换器首页后,在导航栏内点开文档转换,在下拉框内选择Word转PDF.第三步:打开Word转PDF后,点击选择文件,在弹出的窗口里加入待转换的Word文件.第四步:将提前准备好的Word文档添加好后,设置需要转换的页码等参数
利用jacob实现Word转PDF
利用jacob转PDF,poi生成Word(注:仅支持windows平台,需要jacob-1.14.3-x64.dll文件,存放在C:\Windows\System32路径下) 一.步骤: 1.导入所需Jar包 2.生成Word文档 3.转为PDF文件 二.所需Jar包,如图: 三.生成Word文件代码: // 返回Docx中需要替换的特殊字符,没有重复项 // 推荐传入正则表达式参数"\\$\\{[^{}]+\\}" public ArrayList<String> ge
个人永久性免费-Excel催化剂功能第115波-word、pdf、Excel、ppt、html等文件互转
2020年第一波更新,再来个重量级的刚需场景,文件互转.有Excel催化剂后,不再需要频繁到处找寻各种网页在线版的转换操作,数据安全很重要,不要轻易将自己文件上传到网上,哪天出事了,没人可怜! 做最有价值的文件转换而非为转换而转换 文件转换的确是一个非常刚需的功能,滋生了大量的网页在线转换应用,当然也有不少是收费性质的,至于免费的也是有功能限制的如文件大小限制或转换页数限制. 因着没有过硬的数据管理能力,大量的本该在Excel上做结构化存储的数据,被分散地存储在pdf.word.甚至ppt上,这