epub-2格式电子书剖析之一:文档构成

epub格式电子书遵循IDPF推出的OCF规范,OCF规范遵循ZIP压缩技术,即epub电子书本身就是一个ZIP文件,我们将epub格式电子书的后缀.epub修改为.zip后,可以通过解压缩软件(例如winrar、winzip)进行浏览或解压处理。一个未经加密处理的epub电子书以三个部分组成,其文件结构如下图所示:

1、文件:mimetype

每一本epub电子书均包含一个名为mimetype的文件,且内容不变,用以说明epub的文件格式。文件内容如下:

application/epub+zip//注释,表示可以用epub工具和ZIP工具打开

2、目录:META-INF

依据OCF规范,META-INF用于存放容器信息,默认情况下(即加密处理),该目录包含一个文件,即container.xml,文件内容如下:

<?xml version=‘1.0‘ encoding=‘utf-8‘?> <container xmlns="urn:oasis:names:tc:opendocument:xmlns:container" version="1.0"> <rootfiles> <rootfile full-path="OEBPS/content.opf" media-type="application/oebps-package+xml" /> </rootfiles> </container>

container.xml的主要功能用于告诉阅读器,电子书的根文件(rootfile)的路径(红色部分)和打开放式,一般来讲,该container.xml文件也不需要作任何修改,除非你改变了根文件的路径和文件名称。

除container.xml文件之外,OCF还规定了以下几个文件:

(1)[manifest.xml],文件列表(2)[metadata.xml],元数据(3)[signatures.xml],数字签名(4)[encryption.xml],加密(5)[rights.xml],权限管理对于epub电子书而言,这些文件都是可选的。

3、目录:OEBPS

OEBPS目录用于存放OPS文档、OPF文档、CSS文档、NCX文档,如果是制作中文电子书,则还包括ttf文档(即字体文档),OEBPS目录也可以建立相应的子目录,例如建立chapter目录,把各章节的OPS文档放在chapter目录之中。下图一本epub电子书OEBPS文档的实例图:

其中content.opf文件和toc.ncx文件为必需,其它文件可根据电子书的具体情况而定。

content.opf文件见博文OPF剖析

toc.ncx文件见博文toc.ncx剖析

时间: 2024-10-08 08:06:03

epub-2格式电子书剖析之一:文档构成的相关文章

将PDF格式转换成其它文档

经常处理文件工作的朋友相信对PDF格式不会陌生吧,这是Adobe公司所研发的一种专用的网络文件格式,俗称“电子书”,由于它的制作的文档特别适合交流.传播.保密性好等因此在办公领域中一直拥有很高的的使用率.但由于每个公司都有各自具体的要求,好多时候我们都需要快速将PDF格式转换成其它文档.那么今天,笔者就以最常见的PDF转DOC.PDF转Word.PDF转XLS为例向大家讲解一下具体的操作方法. 实现工具:迅捷PDF转换器 应用情景:利用PDF转换器中的健全识别功能来实现PDF转DOC文档在一定程

【.net 深呼吸】使用二进制格式来压缩XML文档

在相当多的情况下,咱们写入XML文件默认是使用文本格式来写入的,如果XML内容是通过网络传输,或者希望节省空间,特别是对于XML文档较大的情况,是得考虑尽可能地压缩XML文件的大小. XmlDictionaryWriter类从XmlWriter类派生,它公开了一些静方法,可以直接创建基于文本.二进制和MTOM格式的XML写入对象.文本格式就不多说了,就是直接把XML内容写入文件,二进制和MTOM相似,都对文件内容进行压缩,说白了,是输出为纯字节形式.MTOM常用于读写SOAP消息. 我们可以做个

gitbook 生成epub/mobi 格式电子书

GitBook 是一个基于 Node.js 的命令行工具,可使用 Github/Git 和 Markdown 来制作精美的电子书.Gitbook 也可用于markdown 格式的文档管理,因为是纯文本的,所以方便版本管理.总来来说gitbook主要有三个方面的用处.1.生成项目的说明文档文版.2.将文档集中起来生成pdf格式文档汇总.3.生成epub或mobi格式的电子书(是我用gitbook的原因). GitBook 是一个基于 Node 开发的命令行工具.因此需要您自行配置 Node 和 n

三种可视化格式模型:普通文档流、相对定位与绝对定位、浮动

在CSS中是有三种定位机制的:普通文档流.浮动和绝对定位.在未指定其它两种定位机制的情况下,所有框都是在普通文档流中定位的. 普通文档流: 普通文档流,顾名思义,就是根据块级元素的标签在HTML里的顺序,像水流一样,从上至下.当然对于行内元素而言,还是在一行中水平排列的. 这里插入一个积累的小知识点. 行内元素可 以在水平(内间距.边框.外边距)方向上修改它们水平尺寸,但是在垂直方向上对行内元素的高度是毫无影响的,还有就是直接定义行内元素的 width/height也是毫无影响.对与行内元素来说

HTML文档基本格式

一.HTML文档基本格式: <!DOCTYPE html>  //文档类型声明 <html lang='zh-cn'>                  //表示HTML文档开始 <head>              //包含文档元数据开始 <meta charset='utf8'>           //声明字符编码 <title>基本</title>     //设置文档标题 </head>     //包含文档元

Atitit.复合文档的格式&#160;标准化格式

Atitit.复合文档的格式 标准化格式 1. Docfile1 2. Iso   Cdf  cd file1 3. Zip1 4. Ooxml1 5. Odf  :OpenDocument Format2 5.1.1. 本质2 6. 参考3 1. Docfile paip.docfile二进制复合文档 前言Docfile Docfile是二进制复合文档,打开文件可看到文件头签名..类似于文件夹存储的方式来存储文档…如以前的DOC文件夹,OLE文档等.. 2. Iso   Cdf  cd fil

【转】WPS文档怎么清除格式

原文网址:http://jingyan.baidu.com/article/c74d600060dc4a0f6a595d21.html 我们知道有时候如果我们粘贴了别的地方的文字到自己的文档里来,就会发生格式错乱的现象,那么我们可以通过清除格式的方式来解决这一问题,具体做法就由小编来告诉大家吧 方法/步骤 首先打开自己已经复制粘贴好的word文档,然后将鼠标移动到文档的左上角WPS文字处   在这里我们可以发现有好多下拉菜单,然后可以在里面找到我们可以进行操作的选项   在下拉菜单里我们可以看到

怎样可以编辑修改PDF格式文档

接收一些文档文件经常会遇到PDF的格式,这种文档编辑处理起来不像word文档那样简单,很多人也不知道该怎样去编辑修改.对PDF文件编辑,是可以直接对PDF文档内容进行编辑修改,或者将PDF转换成Word文档进行编辑修改的. 直接对PDF文件进行编辑修改,需要用PDF编辑器来打开文档.(注意不是PDF阅读器,阅读器不能修改编辑PDF文件) 打开文档后选择编辑内容工具,就可以对内容进编辑修改了,上面的文字也是在文本框中进行操作的,可以选择添加文本工具在页面中插入新的文本框,输入文本内容. 设置文本格

如何将PDF文件转换成word文档格式

以前看一些视频的时候,视频文件会有很多种格式,因为格式播放问题经常会需要转换这些格式.于此相同,现在的一些文档格式的类型也有很多种,有时为了方便应用也会需要转换成不同的文档格式,如何将PDF文档转换成word就是常需要应用到的. 很多文档格式都可以保存输出成PDF文件格式,相同的,将PDF格式也可以转换成其他的文档类型.例如我们常见的一些word,ppt,Excel以及图片文件.并且大部分文档之间也可以进行格式转换.?a.文档格式的转换也是有对应的转换工具的.可以先安装PDF转换器并打开.把PD