分布式缓存系统 Memcached 数据存储slab与hashtable

缓存数据以item为基本单元,以双链表形式存放在对应级别大小的slabclass结构的chunk中。同时该item还存放在链式hashtable中bucket中,用于提供快速查找的索引。

首先是理解缓存的基本数据单元item结构:

typedef struct _stritem {
    struct _stritem *next;    //在slab中的双链表后向指针
    struct _stritem *prev;    //在slab中的双向链表的前向指针
    struct _stritem *h_next;  //指向hash表该bucket中的该item的下一项  /* hash chain next */
    rel_time_t      time;      //最近访问时间戳 /* least recent access */
    rel_time_t      exptime;    //过期时间/* expire time */
    int            nbytes;    //数据大小/* size of data */
    unsigned short  refcount;    //引用计数
    uint8_t        nsuffix;    /* length of flags-and-length string */
    uint8_t        it_flags;  /* ITEM_* above */
    uint8_t        slabs_clsid; //所在的slab,该slab在slabclass数组中的下标/* which slab class we‘re in */
    uint8_t        nkey;      //key的长度/* key length, w/terminating null and padding */
    /* this odd type prevents type-punning issues when we do
    * the little shuffle to save space when not using CAS. */
    union {
        uint64_t cas;
        char end;
    } data[];//真实数据
    /* if it_flags & ITEM_CAS we have 8 bytes CAS */
    /* then null-terminated key */
    /* then " flags length\r\n" (no terminating null) */
    /* then data with terminating \r\n (no terminating null; it‘s binary!) */
} item;

item的结构图如下:

item存放的数据结构slabclass:

//slabclass结构
typedef struct {
    unsigned int size;    //该slab的每个chunk的大小 /* sizes of items */
    unsigned int perslab;  //能存放的size大小的chunk的数量/* how many items per slab */

void *slots;          /* 回收来的item链表,
        当分配出去的item回收时不时将空间还给slab,
        而是直接把该slab从chunk双向链表中删除,
        挂到slots链表的尾部,以供循环利用,
        且在下次使用时不需要再初始化该item结构,
        而是直接更改其各属性值即可list of item ptrs */
    unsigned int sl_curr;  /* 表示当前slots链表中
                            有多少个回收而来的空闲 item.
        total free items in list */

unsigned int slabs;    //已分配的当前种类slab的数量/* how many slabs were allocated for this class */

void **slab_list;      /* 初始时, memcached 为每个级别的slabclass 分配一个slab,
       当这个 slab 内存块使用完后,
       memcached 就分配一个新的 slab,
       所以 slabclass 可以拥有多个同一级别的slab,
       这些 slab 就是通过 slab_list 数组来管理的, 
       slab. array of slab pointers */
    unsigned int list_size; /* 表示当前 slabclass 有多少个slab
       size of prev array */

unsigned int killing;  /* index+1 of dying slab, or zero if none */
    size_t requested;  /* The number of requested bytes */
} slabclass_t;

static slabclass_t slabclass[MAX_NUMBER_OF_SLAB_CLASSES];//slab数组(其中slab按其chunk从小到大排列)

(注意:同一级别的slabclas可能包括多个该级别的slab,维护在指针数组slab_list中)

item在slabclass中存放的结构示意图:

在 slabclass 内, 只有最后一个 slab 存在空闲的内存, 其它 slab 的 chunk 都分配出去了。

end_page_ptr:指向最后一个 slab 中的空闲内存块

end_page_free :表示最后一个 slab 中还剩下多少个空闲 chunk.  图中绿色部分的 chunk 表示空闲 chunk。

每个slabclass维护一个双向链表,所有分配出去的item按照最近访问时间依次放到该链表中,该链表也就相当于LRU队列。

所有slabclass的链表头 尾分表保存在*heads、 *tails两个数组中:

static item *heads[LARGEST_ID];//chunk链表头指针数组:slabclass数组中各级别slabclass的chunk链表头 组成的数组
static item *tails[LARGEST_ID];//chunk链表尾指针数组:slabclass数组中各级别slabclass的chunk链表尾 组成的数组

item空间分配策略:

** 每次需要为新的item分配空间时,首先根据该item的大小,计算出对应级别的slabclass的id,然后在slabclass数组中找到该slabclass。

**  定位到对应slabclass后,首先检查LRU队列的最后一个chunk是否过期,过期则分给用户使用;否则到item回收链表slots中查空闲的chunk;没有回收空闲的chunk则从slab空闲(未分配过得)的chunk中分配;如果没有,则LRU算法在已分配chunk的双向链表中从    尾部向前查找能够释放(最久未访问)的item,依次为新item取得空间。

** 当删除某item时,并不将该chunk空间归还给对应的slab,而是从该slab的已分配chunk链表中删除该chunk ,然后将该chunk挂到回收链表slots的头部,以供循环利用,    并且该chunk中的item也不会释放,直到该chunk被重新利用时直接更新该item的各项属性值。(不用每次都初始化item结构,提高效率!)

链式HsahTable:

同时,slab的chunk链表中的item也被存放到hashTable中。 当需要查找给定key的item时,首先在哈希表中hash到该key对应的item,然后利用hashtable中的item信息得到该item在slabclass中索引位置。

使用了两张hashtable,一个主表,一个“原表”。正常情况下,操作都是在主表中进行的;当正在扩容时,首先在原表中进行操作。

当表中item数量大于表bucket节点数的1.5倍时开始扩容为原来的2倍,采用逐步扩容方式,每次迁移的数量可以设置。  主表与原表是动态切换的,当扩容开始的时候,把主表的类容复制到原表中,让原表替换主表暂时接受操作,而主表容量扩大为原来的两倍,然后逐步从原表中将数据hash到扩容后的主表中,当数据全部迁移完成,所有的操作又回到主表中进行了。

这与Redis中的两张hashtable的操作是一致的。

时间: 2024-08-02 10:57:32

分布式缓存系统 Memcached 数据存储slab与hashtable的相关文章

分布式缓存系统 Memcached 整体架构

分布式缓存系统 Memcached整体架构 Memcached经验分享[架构方向] Memcached 及 Redis 架构分析和比较

分布式缓存系统 Memcached 基本配置与命令

为了方便测试,给出一个C客户端libmemcached链接:https://launchpad.net/libmemcached/ 以及memcacheclient-2.0 : http://code.jellycan.com/files/memcacheclient-2.0.zip(已生成 sln,在windows下直接用VS打开,编译成功) 在Memcached启动时,有很多配置参数可以选择,以下参数对应memcached1.4.15,现给出这些参数的具体含义: "a:" //un

分布式缓存系统Memcached简介与实践

缘起: 在数据驱动的web开发中,经常要重复从数据库中取出相同的数据,这种重复极大的增加了数据库负载.缓存是解决这个问题的好办法.但是ASP.NET中的虽然已经可以实现对页面局部进行缓存,但还是不够灵活.此时Memcached或许是你想要的. Memcached是什么?Memcached是由Danga Interactive开发的,高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度. Memcached能缓存什么?通过在内存里维护一个统一的巨大的hash表,Memc

分布式缓存系统Memcached在Asp.net下的应用

Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度.Memcached基于一个存储键/值对的hashmap.其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信. 站下的session性能并不高,所以造成人们一种印象,大型WEB项目使用Java的错觉,致使很多人吐槽微软不给力,其实这好比拉不出怪地球引力,本

分布式缓存系统Memcached(十二)——基本配置与命令

为了方便测试,给出一个C客户端libmemcached链接:https://launchpad.net/libmemcached/ 以及memcacheclient-2.0 : http://code.jellycan.com/files/memcacheclient-2.0.zip(已生成 sln,在windows下直接用VS打开,编译成功) 在Memcached启动时,有很多配置参数可以选择,以下参数对应memcached1.4.15,现给出这些参数的具体含义: "a:" //un

分布式缓存系统Memcached

Memcached是高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提高访问速度. 通过在内存中维护一个巨大的统一的hash表,Memcached能够用来存储各种格式的数据,包括图像.视频.文件以及数据库检索的结果等. Memcached使用了libevent(如果可以的话,在linux下使用epoll) 来均衡任何数量的打开链接,使用非阻塞的网络I/O,对内部对象实现引用计数(因此,针对多样的客户端,对象可以处在多样的状态), 使用自己的页块分配器和哈希表, 因此虚拟内存不

.NET下实现分布式缓存系统Memcached

一.Memcached服务器端的安装(此处将其作为系统服务安装) 下载文件:memcached 1.2.1 for Win32 binaries (Dec 23, 2006) 下载地址:http://jehiah.cz/projects/memcached-win32/files/memcached-1.2.1-win32.zip 1.解压缩文件到c:\memcached 2.命令行输入 c:\memcached\memcached.exe -d install' 3.命令行输入 c:\memc

分布式缓存系统 Memcached slab和item的主要操作

上节在分析slab内存管理机制时分析Memcached整个Item存储系统的初始化过程slabs_init()函数:分配slabclass数组空间,到最后将各slab划分为各种级别大小的空闲item并挂载到对应大小slab的空闲链表slots上.本节将继续分析对slab和item的主要操作过程. slab机制中所采用的LRU算法: 在memcached运行过程中,要把一个item调入内存,但内存已无空闲空间时,为了保证程序能正常运行,系统必须从内存中调出一部分数据,送磁盘的对换区中.但应将哪些数

分布式缓存系统 Memcached 状态机之网络数据读取与解析

整个状态机的基本流程如下图所示,后续分析将按该流程来进行. 接上节分解,主线程将接收的连接socket分发给了某工作线程,然后工作线程从任务队列中取出该连接socket的CQ_ITEM,开始处理该连接的所有业务逻辑.这个过程也就是上图中的第一个状态conn_listening. 而工作线程首先进入的状态就是conn_new_cmd,即为这个新的连接做一些准备工作,如清理该连接conn结构的读缓冲区等. 准备状态conn_new_cmd具体分析如下: {  <span style="font