redis的跳跃表

跳跃表是一种插入、查询、删除的平均时间复杂度为O(nlogn)的数据结构，在最差情况下是O(n)，当然这几乎很难出现。

和红黑树相比较

最差时间复杂度要差很多，红黑树是O(nlogn)，而跳跃表是O(n)

平均时间复杂度是一样的

实现要简单很多

https://en.wikipedia.org/wiki/Skip_list

维基的跳跃表例子

跳跃表的结构如上图

跳跃表的实现还是一个链表，是一个有序的链表，在遍历的时候基于比较，但普通链表只能遍历，跳跃表加入了一个层的概念，层数越高的元素越少，每次先从高层查找，再逐渐降层，直到找到合适的位置。从图中可以看到高层的节点远远少于底层的节点数，从而实现了跳跃式查找。

redis中的定义

* 跳跃表

typedef struct zskiplist {

// 表头节点和表尾节点

struct zskiplistNode *header, *tail;

// 表中节点的数量

unsigned long length;

// 表中层数最大的节点的层数

int level;

} zskiplist;

跳跃表的节点

* 跳跃表节点

typedef struct zskiplistNode {

// 成员对象

robj *obj;

// 分值

double score;

// 后退指针

struct zskiplistNode *backward;

// 层

struct zskiplistLevel {

// 前进指针

struct zskiplistNode *forward;

// 跨度

unsigned int span;

} level[];

} zskiplistNode;

跳跃表是一个空间换时间的数据结构，和双链表相比，额外的空间开销就是zskiplistNode中的level数组元素，冗余存储了每一层的forward指针。

redis跳跃表实现的一些方法

zslCreateNode

zslCreate

zslFreeNode

zslFree

zslRandomLevel

zslInsert

zslDeleteNode

zslDelete

还有其他一些

重点关注几个方法

* 创建并返回一个新的跳跃表

* T = O(1)

zskiplist *zslCreate(void) {

int j;

zskiplist *zsl;

// 分配空间

zsl = zmalloc(sizeof(*zsl));

// 设置高度和起始层数

zsl->level = 1;

zsl->length = 0;

// 初始化表头节点

//表头一定具有最高的level

// T = O(1)

zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);

for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {

zsl->header->level[j].forward = NULL;

zsl->header->level[j].span = 0;

}

zsl->header->backward = NULL;

// 设置表尾

zsl->tail = NULL;

return zsl;

}

//返回一个随机值，作为新跳跃表节点的层次

//层次的合理分布是跳跃表的效率所在

int zslRandomLevel(void) {

int level = 1;

while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))

level += 1;

return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;

}

* 创建一个成员为 obj ，分值为 score 的新节点，

* 并将这个新节点插入到跳跃表 zsl 中。

* 函数的返回值为新节点。

* T_wrost = O(N^2), T_avg = O(N log N)

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {

zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

unsigned int rank[ZSKIPLIST_MAXLEVEL];

int i, level;

redisAssert(!isnan(score));

// 在各个层查找节点的插入位置

// T_wrost = O(N^2), T_avg = O(N log N)

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

/* store rank that is crossed to reach the insert position */

// 如果 i 不是 zsl->level-1 层

// 那么 i 层的起始 rank 值为 i+1 层的 rank 值

// 各个层的 rank 值一层层累积

// 最终 rank[0] 的值加一就是新节点的前置节点的排位

// rank[0] 会在后面成为计算 span 值和 rank 值的基础

rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];

// 沿着前进指针遍历跳跃表

// T_wrost = O(N^2), T_avg = O(N log N)

while (x->level[i].forward &&

(x->level[i].forward->score < score ||

// 比对分值

(x->level[i].forward->score == score &&

// 比对成员， T = O(N)

compareStringObjects(x->level[i].forward->obj,obj) < 0))) {

// 记录沿途跨越了多少个节点

rank[i] += x->level[i].span;

// 移动至下一指针

x = x->level[i].forward;

}

// 记录将要和新节点相连接的节点

update[i] = x;

}

/* we assume the key is not already inside, since we allow duplicated

* scores, and the re-insertion of score and redis object should never

* happen since the caller of zslInsert() should test in the hash table

* if the element is already inside or not.

* zslInsert() 的调用者会确保同分值且同成员的元素不会出现，

* 所以这里不需要进一步进行检查，可以直接创建新元素。

// 获取一个随机值作为新节点的层数

// T = O(N)

level = zslRandomLevel();

// 如果新节点的层数比表中其他节点的层数都要大

// 那么初始化表头节点中未使用的层，并将它们记录到 update 数组中

// 将来也指向新节点

if (level > zsl->level) {

// 初始化未使用层

// T = O(1)

for (i = zsl->level; i < level; i++) {

rank[i] = 0;

update[i] = zsl->header;

update[i]->level[i].span = zsl->length;

}

// 更新表中节点最大层数

zsl->level = level;

}

// 创建新节点

x = zslCreateNode(level,score,obj);

// 将前面记录的指针指向新节点，并做相应的设置

// T = O(1)

for (i = 0; i < level; i++) {

// 设置新节点的 forward 指针

x->level[i].forward = update[i]->level[i].forward;

// 将沿途记录的各个节点的 forward 指针指向新节点

update[i]->level[i].forward = x;

/* update span covered by update[i] as x is inserted here */

// 计算新节点跨越的节点数量

x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);

// 更新新节点插入之后，沿途节点的 span 值

// 其中的 +1 计算的是新节点

update[i]->level[i].span = (rank[0] - rank[i]) + 1;

}

/* increment span for untouched levels */

// 未接触的节点的 span 值也需要增一，这些节点直接从表头指向新节点

// T = O(1)

for (i = level; i < zsl->level; i++) {

update[i]->level[i].span++;

}

// 设置新节点的后退指针

x->backward = (update[0] == zsl->header) ? NULL : update[0];

if (x->level[0].forward)

x->level[0].forward->backward = x;

else

zsl->tail = x;

// 跳跃表的节点计数增一

zsl->length++;

return x;

}

跳跃表查找节点的过程（以插入元素为例，删除、查找的过程是一样的）

1.从head开始，根据forward指针向前查找，如果前一个元素大于待查找的元素或者遇到tail指针，下移层次继续查找；如果下一个元素不大于待查找的元素，forward向前推进一个节点，继续比较。

2.重复1步骤，直到level1遇到的前一个节点的值大于待查找的值

最终总是能找到比待查找节点的值大的前一个位置，在这个位置插入元素。

时间： 2024-10-10 13:49:52

redis的跳跃表的相关文章

学习笔记-Redis设计与实现-跳跃表

跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的. 跳跃表支持平均O(logN).最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点. Redis使用跳跃表作为有序结合键的底层实现之一,如果一个有序集合包含的元素数量比较多,又或者有序集合中元素的成员(member)是比较长的字符串时,Redis就会使用跳跃表来作为有序集合见的底层实现. 5.1 跳跃表的实现 zskiplist结构,包含以下属性: header:

redis - 跳跃表详细介绍

redis吸引很多人使用的一个重要的原因,就是它对众多数据类型的支持.包括string,hash,set,zset,list等五种数据对象. 其中zset用来保证数据的有序存储,实现中,redis使用跳跃表和压缩列表,作为zset的底层实现.当元素数量比较多,或者元素成员是比较长的字符串时,底层实现采用跳跃表. 跳跃表是什么? 一种有序的数据结构,通过在节点中维持多个指向其它节点的指针,达到快速访问的目的. 跳跃表的好处是什么? 1. 跟平衡树相比,实现简单: 2. 平均复杂度为O(logN),

redis 系列7 数据结构之跳跃表

一.概述跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的.在大部分情况下,跳跃表的效率可以和平衡树(关系型数据库的索引就是平衡树结构)相媲美,并且因为跳跃表的实现比平衡树要来得更为简单,所以有不少程序使用跳跃表来代替平衡树. Redis使用跳跃表作为"有序集合键"的底层实现之一,如果一个有序集合包含的元素数量比较多,又或者有序集合中元素的成员是比较长的字符串时,Redis就会使用跳跃表来作为有序集合键的底层实现.

redis源码（五）跳跃表（zskiplist）

1.跳跃表 redis使用跳跃表在两个地方:实现有序集合键?集群节点中用作内部数据结构? 一种有序的数据结构,在每个节点维护多个指向后续节点的指针,完成快速访问后续节点的功能,即就是链表增加了多级索引 Redis的跳跃表由如下:两个结构定义,其中 zskiplistNode结构用于表示跳跃表节点,而 zskiplist结构则用于保存跳跃表节点的相关信息,比如节点的数量,以及指向表头节点和表尾节点的指针等等 typedef struct zskiplistNode { robj *obj; dou

redis源码分析4---结构体---跳跃表

redis源码分析4---结构体---跳跃表跳跃表是一种有序的数据结构,他通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的: 跳跃表支持平均O(logN),最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点.性能上和平衡树媲美,因为事先简单,常用来代替平衡树. 在redis中,只在两个地方使用了跳跃表,一个是实现有序集合键,另一个是在集群节点中用作内部数据结构. 1 跳跃表节点 1.1 层层的数量越多,访问其他节点的速度越快: 1.2 前进指针遍历举例

Redis中的跳跃表

Redis中的跳跃表跳跃表是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的跳跃表支持平均O(logN),最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点跳跃表在Redis用于实现有序集合键和在集群节点中用作内部数据结构跳跃表的实现 // 跳跃表节点 typedef struct zskiplistNode { // 层 struct zskiplistLevel { // 前进指针 struct zskiplistNode *f

redis跳跃表

最近在阅读redis设计与实现,关于redis数据结构zset的一种底层实现跳跃表一直没有太理解,所以在搜了一下资料,终于搞懂了它的设计思路,记录一下. 参考链接:https://mp.weixin.qq.com/s?src=11&timestamp=1553915878&ver=1515&signature=SuSdA-Ka7Bs7CzSnNHgHFR7DkFFibGdRUui-FkuSRn2OJOkn6uvGznFMheSfoxaSHYlcgfGnBQ9imQdTAg5hiaq

redis 5.0.7 源码阅读——跳跃表skiplist

redis中并没有专门给跳跃表两个文件.在5.0.7的版本中,结构体的声明与定义.接口的声明在server.h中,接口的定义在t_zset.c中,所有开头为zsl的函数. 一.数据结构单个节点: typedef struct zskiplistNode { //key,唯一 sds ele; //分值,可重复 double score; //后退指针 struct zskiplistNode *backward; //层 struct zskiplistLevel { //前进指针 struc

跳跃表SkipList

SkipList在各种开源引擎中用处普遍,例如redis的sortedset容器.luence里面的索引字典等均用到了skiplist. 1.SkipList 在数据结构里面,我们知道有两种基本数据存储结构:数组和链表.它们均有其各自的特点,数组(特别是有序数组),可以进行快速查询,但不便于删除操作;链表,可以进行快速的增删操作,但是又不便于查询.那有没可能存在一种数据结构,结合两者各自的优点呢? 基于这样的思路,William Pugh这位马里兰大学的计算机教授,于1989年提