LevelDB源码之四LOG文件

“LOG文件在LevelDb中的主要作用是系统故障恢复时,能够保证不会丢失数据。因为在将记录写入内存的Memtable之前,会先写入Log文件,这样即使系统发生故障,Memtable中的数据没有来得及Dump到磁盘的SSTable文件,LevelDB也可以根据log文件恢复内存的Memtable数据结构内容,不会造成系统丢失数据,在这点上LevelDb和Bigtable是一致的。” (http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html)

准备工作:

Log文件只涉及顺序读、顺序写两种操作,而在LevelDB中的其他文件(如SSTable)还会设计随机读操作,作者针对每种操作类型做了封装:

 1     class SequentialFile {
 2     public:
 3         virtual Status Read(size_t n, Slice* result, char* scratch) = 0;
 4         virtual Status Skip(uint64_t n) = 0;
 5     };
 6     class RandomAccessFile {
 7     public:
 8         virtual Status Read(uint64_t offset, size_t n, Slice* result,
 9             char* scratch) const = 0;
10     };
11     class WritableFile {
12     public:
13         virtual Status Append(const Slice& data) = 0;
14         virtual Status Close() = 0;
15         virtual Status Flush() = 0;
16         virtual Status Sync() = 0;
17     };

操作系统相关操作在不同系统下,实现各不相同,作者也做了统一的接口封装(跨平台),称之为“环境类”Env:

 1     class Env {
 2     public:
 3         Env() { }
 4         virtual ~Env();
 5
 6         // Return a default environment suitable for the current operating
 7         // system.
 8         static Env* Default();
 9
10     //基于不同的操作系统实现了各种文件类型的具体类,通过该工厂方法返回。
11         virtual Status NewSequentialFile(const std::string& fname, SequentialFile** result) = 0;
12         virtual Status NewRandomAccessFile(const std::string& fname, RandomAccessFile** result) = 0;
13         virtual Status NewWritableFile(const std::string& fname, WritableFile** result) = 0;
14 ......
15     };

写入

Leveldb命名空间下,有一个名为log的子命名空间,其下有Writer、Reader两个实现类。按前几节的命名规则,Writer其实是一个Builder,它对外提供了唯一的AddRecord方法用于追加操作记录。

 1         Status Writer::AddRecord(const Slice& slice) {
 2             const char* ptr = slice.data();
 3             size_t left = slice.size();
 4
 5             // Fragment the record if necessary and emit it.  Note that if slice
 6             // is empty, we still want to iterate once to emit a single
 7             // zero-length record
 8             Status s;
 9             bool begin = true;
10             do {
11                 const int leftover = kBlockSize - block_offset_;    //1. 当前块剩余大小
12                 assert(leftover >= 0);
13                 if (leftover < kHeaderSize)                         //2. 剩余大小不足,占位
14                 {
15                     // Switch to a new block
16                     if (leftover > 0)
17                     {
18                         // Fill the trailer (literal below relies on kHeaderSize being 7)
19                         assert(kHeaderSize == 7);
20                         dest_->Append(Slice("\x00\x00\x00\x00\x00\x00", leftover));
21                     }
22                     block_offset_ = 0;
23                 }
24
25                 // Invariant: we never leave < kHeaderSize bytes in a block.
26                 assert(kBlockSize - block_offset_ - kHeaderSize >= 0);
27
28                 const size_t avail = kBlockSize - block_offset_ - kHeaderSize;
29                 const size_t fragment_length = (left < avail) ? left : avail;    //3. 当前块存储的空间大小
30
31                 RecordType type;                                                //4. Record Type
32                 const bool end = (left == fragment_length);
33                 if (begin && end) {
34                     type = kFullType;
35                 }
36                 else if (begin) {
37                     type = kFirstType;
38                 }
39                 else if (end) {
40                     type = kLastType;
41                 }
42                 else {
43                     type = kMiddleType;
44                 }
45
46                 s = EmitPhysicalRecord(type, ptr, fragment_length);            //5. 写入文件
47                 ptr += fragment_length;
48                 left -= fragment_length;
49                 begin = false;
50             } while (s.ok() && left > 0);
51             return s;
52         }

备忘如下:

  1. Log文件被逻辑上分为多个Block,每个Block大小为32K。
  2. 每条记录由Record Header + Record Content组成,其中Header大小为kHeaderSize(7字节)。
  3. 当前Block剩余大小不足以填充Record Header时,以"\x00\x00\x00\x00\x00\x00"占位。
  4. 当Block无法完整记录一条Record时,通过type信息标识该record在当前block中的区块信息,以便读取时可根据type拼接出完整的record。
  5. EmitPhysicalRecord向Block中插入Record数据
  6. 每个Record结构如下:

Header


Record Content


CRC


Record Size


Type


Record Content

读取

Log读取逻辑并无特别之处,略。

原本Current、Manifest与Log打算一起备注,但要搞清楚Manifest,LevelDB的版本机制必定要搞清楚,而这本身又是很丰富的内容。

时间: 2024-08-07 00:16:33

LevelDB源码之四LOG文件的相关文章

LevelDB源码剖析

LevelDB的公共部件并不复杂,但为了更好的理解其各个核心模块的实现,此处挑几个关键的部件先行备忘. Arena(内存领地) Arena类用于内存管理,其存在的价值在于: 提高程序性能,减少Heap调用次数,由Arena统一分配后返回到应用层. 分配后无需执行dealloc,当Arena对象释放时,统一释放由其创建的所有内存. 便于内存统计,如Arena分配的整体内存大小等信息. 1 class Arena { 2 public: 3 Arena(); 4 ~Arena(); 5 6 // R

leveldb源码分析--SSTable之Compaction

对于compaction是leveldb中体量最大的一部分,也应该是最为复杂的部分,为了便于理解我们首先从一些基本的概念开始.下面是一些从doc/impl.html中翻译和整理的内容: Level 0 当日志文件超过一定大小的阈值是 (默认为 1MB): 建立一个新的memtable和日志文件,以后的操作都是用新的memtable和日志文件 后台进行如下操作: 将旧的 memtable写到SSTable中(过程为先转为immtable_table,然后遍历写入) 废弃旧的 memtable 删除

leveldb源码分析--日志

我们知道在一个数据库系统中为了保证数据的可靠性,我们都会记录对系统的操作日志.日志的功能就是用来在系统down掉的时候对数据进行恢复,所以日志系统对一个要求可靠性的存储系统是极其重要的.接下来我们分析leveldb的日志,首先在leveldb源码目录中有doc/log_format.txt,这个文件详细的描述了leveldb的日志格式: record := checksum: uint32 // crc32c of type and data[] ; little-endian length:

leveldb源码分析--插入删除流程

由于网络上对leveldb的分析文章都比较丰富,一些基础概念和模型都介绍得比较多,所以本人就不再对这些概念以专门的篇幅进行介绍,本文主要以代码流程注释的方式. 首先我们从db的插入和删除开始以对整个体系有一个感性的认识,首先看插入: Status DB::Put(const WriteOptions& opt, const Slice& key, const Slice& value) { WriteBatch batch; //leveldb中不管单个插入还是多个插入都是以Wri

leveldb源码分析--Key结构

[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版 经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念.这篇文章本来应该顺理成章的介绍Batch相关流程和结构了,但是Batch涉及到了一些编码和Key相关的概念,所以我觉得应该先理清这方面的概念有助于大家更容易理解后面的内容. 在dbformat.h/cc文件中我们首先看到的是 typedef uint64_t SequenceNumber; str

leveldb源码分析—Recover和Repair

leveldb作为一个KV存储引擎将数据持久化到磁盘,而对于一个存储引擎来说在存储过程中因为一些其他原因导致程序down掉甚至数据文件被破坏等都会导致程序不能按正常流程再次启动.那么遇到这些状况以后如何使程序最大程度的恢复数据就是非常重要的一项工作,leveldb也提供了这方面的工作. 首先来看recover,这是每一次启动数据库的时候都会呗调用到的流程.其功能是恢复数据库在运行中突然因为某些原因down掉而这个时候leveldb中的丢失的当前状态,以及memtable甚至immtable中还未

leveldb 源码--总体架构分析

一 本文目的 对leveldb的总体设计框架分析(关于leveldb基本原理,此文不做阐述,读者可以自行检索文章阅读即可),对leveldb中底层数据存储数据格式,内存数据模型,compact,版本管理,快照等机制实现介绍以及整个leveldb实现源码中各文件的源码实现职责,方便快速对leveldb有个总体的掌握 二 各特性机制的实现 1.leveldb的底层数据格式存储 leveldb底层数据格式,网上很多文章都有介绍,在此不做赘述,主要介绍一下上层怎么讲数据写入磁盘中. leveldb中k-

LevelDB源码分析--Iterator

我们先来参考来至使用Iterator简化代码2-TwoLevelIterator的例子,略微修改希望能帮助更加容易立即,如果有不理解请各位看客阅读原文. 下面我们再来看一个例子,我们为一个书店写程序,书店里有许多书Book,每个书架(BookShelf)上有多本书. 类结构如下所示 class Book { private: string book_name_; }; class Shelf { private: vector<Book> books_; }; 如何遍历书架上所有的书呢?一种实

android源码大放送(实战开发必备),免费安卓demo源码,例子大全文件详细列表

免费安卓demo源码,例子大全文件详细列表 本列表源码永久免费下载地址:http://www.jiandaima.com/blog/android-demo 卷 yunpan 的文件夹 PATH 列表 卷序列号为 0000-73EC E:. │ jiandaima.com文件列表生成.bat │ 例子大全说明.txt │ 本例子永久更新地址~.url │ 目录列表2016.03.10更新.txt │ ├─前台界面 │ ├─3D标签云卡片热门 │ │ Android TagCloudView云标签