leveldb源码分析--Memtable

本节讲述内存中LevelDB的数据结构Memtable，Memtable义如其名即为内存中的KV Table，即LSM-Tree中的C0 Tree。我们知道在LSM-Tree中刚插入的的KV数据都是存储在内存中，当内存中存储的数据超过一定量以后再写到磁盘中。而对于leveldb来说这个过程演变为内存中的数据都是插入到MemTable中，当MemTable中的数据超过一定量（Options.write_buffer_size）以后MemTable就转化为Immutable Memtable等待dump到磁盘中的SSTable中。Immutable Memtable从结构上讲和Memtable是完全一样的，区别仅仅在于其是只读的，不允许写入操作，而Memtable则是允许写入和读取的，而当MemTable转化为Immutable MemTable时会生成一个MemTable。

为了理解MemTable，我们首先看一下他包含了那些成员变量

typedef SkipList<const char*, KeyComparator> Table;

  KeyComparator comparator_;  //比较器，用来判断Key的顺序，稍后介绍
  int refs_;                  //引用计数，当引用为0时作一个自我销毁
  Arena arena_;               //简易的内存池
  Table table_;               //保存KV对的实际结构，其为一个SkipList

上文提到了当内存中的数据超过一定的量时，MemTable就会转化为Immutable Table，这个量的管理和判断就是通过Arena来实现的。它的工作十分简单，将申请到的内存块放入std::vector blocks_中，在Arena的生命周期结束后，统一释放掉所有申请到的内存，内部结构如图所示：

只是在处理时涉及到了一个小技巧，Arena会先预先分配一块4K大小的内存，如果后继有内存请求就从其中进行获取，如果剩下的空间不够请求就又两种处理方式：1. 申请大小 > 1K，那么直接申请一块新的对应的大小并存入vector中；2. 申请大小 <= 1K, 申请一块4K的内存，然后在其中分配相应大小的空间给请求者。

Arena主要提供了两个申请函数：其中一个直接分配内存，另一个可以申请对齐的内存空间。这种设计应该说这是和leveldb特定的应用场景相关的，比如一个memtable使用一个Arena，当memtable被释放时，由Arena统一释放其内存。而小内存预先分配的方式可以有效减少内存申请的系统调用的次数，降低对应的开销。理解了流程，我们还是看看代码吧：

char* alloc_ptr_;            //当前预分配的4K的地址指针
   size_t alloc_bytes_remaining_; //预分配内存尚未使用的大小
   std::vector<char*> blocks_;     //已经分配的内存地址指针集合
   size_t blocks_memory_;          //已经分配的内存大小

申请流程，只列出申请不不对齐的方法，申请对齐的内存只是加了一个内存对齐的过程，逻辑很简单

inline char* Arena::Allocate(size_t bytes) {
  if (bytes <= alloc_bytes_remaining_) {
    //剩余内存大于申请，直接从预分配的内存中取走相应大小
    char* result = alloc_ptr_;
    alloc_ptr_ += bytes;
    alloc_bytes_remaining_ -= bytes;
    return result;
  }
  return AllocateFallback(bytes);
}

char* Arena::AllocateFallback(size_t bytes) {
  //if > 1K 直接分配一块内存然后返回给申请者
  if (bytes > kBlockSize / 4) {
    char* result = AllocateNewBlock(bytes);
    return result;
  }

  // 否则申请一块 4K 的内存然后取相应的大小返回给请求者.
  alloc_ptr_ = AllocateNewBlock(kBlockSize);
  alloc_bytes_remaining_ = kBlockSize;

  char* result = alloc_ptr_;
  alloc_ptr_ += bytes;
  alloc_bytes_remaining_ -= bytes;
  return result;
}

这里Arena的使用原理就分析完成了，在其析构的时候会释放掉所有的内存。

至于SkipList leveldb也就是对齐有一个具体的实现，对齐详细的介绍和说明有一篇文章《SkipList 跳表》有详细的介绍。接下来的文章我们介绍一下MemTable的迭代器和Comparator。

leveldb源码分析--Memtable,布布扣,bubuko.com

时间： 2024-12-21 12:18:18

leveldb源码分析--Memtable

leveldb源码分析--Memtable的相关文章

leveldb源码分析--SSTable之TableBuilder

LevelDB源码分析--Cache及Get查找流程

leveldb源码分析--SSTable之Compaction

leveldb源码分析--插入删除流程

leveldb源码分析--Key结构

leveldb源码分析--WriteBatch

leveldb源码分析--Comparator

leveldb源码分析—Recover和Repair

LevelDB源码分析--Iterator