redis的跳跃表

跳跃表是一种插入、查询、删除的平均时间复杂度为O(nlogn)的数据结构,在最差情况下是O(n),当然这几乎很难出现。

和红黑树相比较

最差时间复杂度要差很多,红黑树是O(nlogn),而跳跃表是O(n)

平均时间复杂度是一样的

实现要简单很多

https://en.wikipedia.org/wiki/Skip_list

维基的跳跃表例子

跳跃表的结构如上图

跳跃表的实现还是一个链表,是一个有序的链表,在遍历的时候基于比较,但普通链表只能遍历,跳跃表加入了一个层的概念,层数越高的元素越少,每次先从高层查找,再逐渐降层,直到找到合适的位置。从图中可以看到高层的节点远远少于底层的节点数,从而实现了跳跃式查找。

redis中的定义

/*

* 跳跃表

*/

typedef struct zskiplist {

// 表头节点和表尾节点

struct zskiplistNode *header, *tail;

// 表中节点的数量

unsigned long length;

// 表中层数最大的节点的层数

int level;

} zskiplist;

跳跃表的节点

/*

* 跳跃表节点

*/

typedef struct zskiplistNode {

// 成员对象

robj *obj;

// 分值

double score;

// 后退指针

struct zskiplistNode *backward;

// 层

struct zskiplistLevel {

// 前进指针

struct zskiplistNode *forward;

// 跨度

unsigned int span;

} level[];

} zskiplistNode;

跳跃表是一个空间换时间的数据结构,和双链表相比,额外的空间开销就是zskiplistNode中的level数组元素,冗余存储了每一层的forward指针。

redis跳跃表实现的一些方法

zslCreateNode

zslCreate

zslFreeNode

zslFree

zslRandomLevel

zslInsert

zslDeleteNode

zslDelete

还有其他一些

重点关注几个方法

/*

* 创建并返回一个新的跳跃表

*

* T = O(1)

*/

zskiplist *zslCreate(void) {

int j;

zskiplist *zsl;

// 分配空间

zsl = zmalloc(sizeof(*zsl));

// 设置高度和起始层数

zsl->level = 1;

zsl->length = 0;

// 初始化表头节点

//表头一定具有最高的level

// T = O(1)

zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);

for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {

zsl->header->level[j].forward = NULL;

zsl->header->level[j].span = 0;

}

zsl->header->backward = NULL;

// 设置表尾

zsl->tail = NULL;

return zsl;

}

//返回一个随机值,作为新跳跃表节点的层次

//层次的合理分布是跳跃表的效率所在

int zslRandomLevel(void) {

int level = 1;

while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))

level += 1;

return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;

}

/*

* 创建一个成员为 obj ,分值为 score 的新节点,

* 并将这个新节点插入到跳跃表 zsl 中。

*

* 函数的返回值为新节点。

*

* T_wrost = O(N^2), T_avg = O(N log N)

*/

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {

zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

unsigned int rank[ZSKIPLIST_MAXLEVEL];

int i, level;

redisAssert(!isnan(score));

// 在各个层查找节点的插入位置

// T_wrost = O(N^2), T_avg = O(N log N)

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

/* store rank that is crossed to reach the insert position */

// 如果 i 不是 zsl->level-1 层

// 那么 i 层的起始 rank 值为 i+1 层的 rank 值

// 各个层的 rank 值一层层累积

// 最终 rank[0] 的值加一就是新节点的前置节点的排位

// rank[0] 会在后面成为计算 span 值和 rank 值的基础

rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];

// 沿着前进指针遍历跳跃表

// T_wrost = O(N^2), T_avg = O(N log N)

while (x->level[i].forward &&

(x->level[i].forward->score < score ||

// 比对分值

(x->level[i].forward->score == score &&

// 比对成员, T = O(N)

compareStringObjects(x->level[i].forward->obj,obj) < 0))) {

// 记录沿途跨越了多少个节点

rank[i] += x->level[i].span;

// 移动至下一指针

x = x->level[i].forward;

}

// 记录将要和新节点相连接的节点

update[i] = x;

}

/* we assume the key is not already inside, since we allow duplicated

* scores, and the re-insertion of score and redis object should never

* happen since the caller of zslInsert() should test in the hash table

* if the element is already inside or not.

*

* zslInsert() 的调用者会确保同分值且同成员的元素不会出现,

* 所以这里不需要进一步进行检查,可以直接创建新元素。

*/

// 获取一个随机值作为新节点的层数

// T = O(N)

level = zslRandomLevel();

// 如果新节点的层数比表中其他节点的层数都要大

// 那么初始化表头节点中未使用的层,并将它们记录到 update 数组中

// 将来也指向新节点

if (level > zsl->level) {

// 初始化未使用层

// T = O(1)

for (i = zsl->level; i < level; i++) {

rank[i] = 0;

update[i] = zsl->header;

update[i]->level[i].span = zsl->length;

}

// 更新表中节点最大层数

zsl->level = level;

}

// 创建新节点

x = zslCreateNode(level,score,obj);

// 将前面记录的指针指向新节点,并做相应的设置

// T = O(1)

for (i = 0; i < level; i++) {

// 设置新节点的 forward 指针

x->level[i].forward = update[i]->level[i].forward;

// 将沿途记录的各个节点的 forward 指针指向新节点

update[i]->level[i].forward = x;

/* update span covered by update[i] as x is inserted here */

// 计算新节点跨越的节点数量

x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);

// 更新新节点插入之后,沿途节点的 span 值

// 其中的 +1 计算的是新节点

update[i]->level[i].span = (rank[0] - rank[i]) + 1;

}

/* increment span for untouched levels */

// 未接触的节点的 span 值也需要增一,这些节点直接从表头指向新节点

// T = O(1)

for (i = level; i < zsl->level; i++) {

update[i]->level[i].span++;

}

// 设置新节点的后退指针

x->backward = (update[0] == zsl->header) ? NULL : update[0];

if (x->level[0].forward)

x->level[0].forward->backward = x;

else

zsl->tail = x;

// 跳跃表的节点计数增一

zsl->length++;

return x;

}

跳跃表查找节点的过程(以插入元素为例,删除、查找的过程是一样的)

1.从head开始,根据forward指针向前查找,如果前一个元素大于待查找的元素或者遇到tail指针,下移层次继续查找;如果下一个元素不大于待查找的元素,forward向前推进一个节点,继续比较。

2.重复1步骤,直到level1遇到的前一个节点的值大于待查找的值

最终总是能找到比待查找节点的值大的前一个位置,在这个位置插入元素。

时间: 2024-10-10 13:49:52

redis的跳跃表的相关文章

学习笔记-Redis设计与实现-跳跃表

跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的. 跳跃表支持平均O(logN).最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点. Redis使用跳跃表作为有序结合键的底层实现之一,如果一个有序集合包含的元素数量比较多,又或者有序集合中元素的成员(member)是比较长的字符串时,Redis就会使用跳跃表来作为有序集合见的底层实现. 5.1 跳跃表的实现 zskiplist结构,包含以下属性: header:

redis - 跳跃表详细介绍

redis吸引很多人使用的一个重要的原因,就是它对众多数据类型的支持.包括string,hash,set,zset,list等五种数据对象. 其中zset用来保证数据的有序存储,实现中,redis使用跳跃表和压缩列表,作为zset的底层实现.当元素数量比较多,或者元素成员是比较长的字符串时,底层实现采用跳跃表. 跳跃表是什么? 一种有序的数据结构,通过在节点中维持多个指向其它节点的指针,达到快速访问的目的. 跳跃表的好处是什么? 1. 跟平衡树相比,实现简单: 2. 平均复杂度为O(logN),

redis 系列7 数据结构之跳跃表

一.概述 跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的.在大部分情况下,跳跃表的效率可以和平衡树(关系型数据库的索引就是平衡树结构)相媲美,并且因为跳跃表的实现比平衡树要来得更为简单,所以有不少程序使用跳跃表来代替平衡树. Redis使用跳跃表作为"有序集合键"的底层实现之一,如果一个有序集合包含的元素数量比较多,又或者有序集合中元素的成员是比较长的字符串时,Redis就会使用跳跃表来作为有序集合键的底层实现.

redis源码(五)跳跃表(zskiplist)

1.跳跃表 redis使用跳跃表在两个地方:实现有序集合键?集群节点中用作内部数据结构? 一种有序的数据结构,在每个节点维护多个指向后续节点的指针,完成快速访问后续节点的功能,即就是链表增加了多级索引 Redis的跳跃表由如下:两个结构定义,其中 zskiplistNode结构用于表示跳跃表节点,而 zskiplist结构则用于保存跳跃表节点的相关信息,比如节点的数量,以及指向表头节点和表尾节点的指针等等 typedef struct zskiplistNode { robj *obj; dou

redis源码分析4---结构体---跳跃表

redis源码分析4---结构体---跳跃表 跳跃表是一种有序的数据结构,他通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的: 跳跃表支持平均O(logN),最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点.性能上和平衡树媲美,因为事先简单,常用来代替平衡树. 在redis中,只在两个地方使用了跳跃表,一个是实现有序集合键,另一个是在集群节点中用作内部数据结构. 1 跳跃表节点 1.1 层 层的数量越多,访问其他节点的速度越快: 1.2 前进指针 遍历举例

Redis中的跳跃表

Redis中的跳跃表 跳跃表是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的 跳跃表支持平均O(logN),最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点 跳跃表在Redis用于实现有序集合键和在集群节点中用作内部数据结构 跳跃表的实现 // 跳跃表节点 typedef struct zskiplistNode { // 层 struct zskiplistLevel { // 前进指针 struct zskiplistNode *f

redis跳跃表

最近在阅读redis设计与实现,关于redis数据结构zset的一种底层实现跳跃表一直没有太理解,所以在搜了一下资料,终于搞懂了它的设计思路,记录一下. 参考链接:https://mp.weixin.qq.com/s?src=11&timestamp=1553915878&ver=1515&signature=SuSdA-Ka7Bs7CzSnNHgHFR7DkFFibGdRUui-FkuSRn2OJOkn6uvGznFMheSfoxaSHYlcgfGnBQ9imQdTAg5hiaq

redis 5.0.7 源码阅读——跳跃表skiplist

redis中并没有专门给跳跃表两个文件.在5.0.7的版本中,结构体的声明与定义.接口的声明在server.h中,接口的定义在t_zset.c中,所有开头为zsl的函数. 一.数据结构 单个节点: typedef struct zskiplistNode { //key,唯一 sds ele; //分值,可重复 double score; //后退指针 struct zskiplistNode *backward; //层 struct zskiplistLevel { //前进指针 struc

跳跃表SkipList

SkipList在各种开源引擎中用处普遍,例如redis的sortedset容器.luence里面的索引字典等均用到了skiplist. 1.SkipList     在数据结构里面,我们知道有两种基本数据存储结构:数组和链表.它们均有其各自的特点,数组(特别是有序数组),可以进行快速查询,但不便于删除操作;链表,可以进行快速的增删操作,但是又不便于查询.那有没可能存在一种数据结构,结合两者各自的优点呢?     基于这样的思路,William Pugh这位马里兰大学的计算机教授,于1989年提