数据结构和算法之——跳表

之前我们知道，二分查找依赖数组的随机访问，所以只能用数组来实现。如果数据存储在链表中，就真的没法用二分查找了吗？而实际上，我们只需要对链表稍加改造，就可以实现类似“二分”的查找算法，这种改造之后的数据结构叫作跳表（Skip List）。

1. 何为跳表？

对于一个单链表，即使链表是有序的，如果我们想要在其中查找某个数据，也只能从头到尾遍历链表，这样效率自然就会很低。

假如我们对链表每两个结点提取一个结点到上一级，然后建立一个索引指向原始结点，如下图所示。

这时候，我们要查找某一个数据的时候，就可以先在索引里面查找出一个大的范围，然后再下降到原始链表中精确查找。

比如，我们要查找 16，我们发现 16 位于 13 和 17 之间，这时候，我们就从 13 的地方下降到原始链表，然后再往后查询。原来我们查找 16，需要遍历 10 个结点，现在只需要遍历 7 个结点。

我们发现，加一层索引后，查找一个结点需要遍历的次数减少了，也就是查找效率提高了。

那么我们再多加一级索引呢？效果会不会有更大提升？

这一次，我们只需要遍历 6 个结点了。

数据量不大的时候这种方法可能效率提高得还不是很明显，下面看一个包含 64 个结点的例子，这次我们建立了五级索引。

查找 62 的时候原来需要遍历 62 次，现在只需要 11 次即可。针对链表长度比较大的时候，构建索引查找效率的提升就会非常明显。

2. 跳表查询的分析？

如果链表中总共有 \(n\) 个结点，那么第一级索引就有 \(\frac{n}{2}\) 个结点，第二级索引就有 \(\frac{n}{4}\) 个结点，以此类推，那么第 \(k\) 级索引就有 \(\frac{n}{2^k}\) 个结点。如果最高级索引有 2 个结点，那总的索引级数 \(k = log_2n - 1\)，如果我们算上原始链表的话，那也就是总共有 \(log_2n\) 级。

在第 \(k\) 级索引中，假设我们要查找的数据为 \(x\)，当我们查找到 \(y\) 结点时，发现 \(y < x < z\) 时此时我们就要下降到 \(k-1\) 级索引继续查找。在第 \(k-1\) 级索引中，\(y\) 和 \(z\) 之间只有三个结点，因此，我们最多只需要查找 3 个结点。以此类推，每一级的索引最多都只需要遍历 3 个结点。

而总的级别数为 \(log_2n\)，因此查找的时间复杂度就为 \(3* log_2n = logn\)。跳表查找的时间复杂度和二分查找一样，但这其实是以空间来换时间的设计思路。

跳表的所有额外索引结点总数为 \(\frac{n}{2} + \frac{n}{4} + \frac{n}{8} + ... + 4 + 2 = n-2\)，所以跳表的空间复杂度为 \(O(n)\)。

但如果我们每三个结点建立一个索引，这时候额外需要的结点总数为 \(\frac{n}{2}\)，虽然空间复杂度依然为 \(O(n)\)，但减少了一半的索引节点存储空间。

实际上，在实际开发中，原始链表中存储的可能是很大的对象，而索引结点只需要存储关键值和几个指针，其额外占用的空间可以被忽略掉。

3. 跳表高效的动态插入和删除？

在链表中，如果我们知道要插入数据的位置，那么插入的时间复杂度就为 \(O(1)\)。在跳表中，查找的时间复杂度为 \(O(logn)\)，因此，动态插入数据的时间复杂度也就是 \(O(logn)\) 了。

从链表中删除结点的时候，如果结点在索引中也有出现，那么我们除了要删除原始链表中的结点，还要删除索引中的。

当我们不停地往跳表中插入数据的时候，如果我们不更新索引，就有可能出现某两个结点之间数据非常多的情况。极端情况下，跳表还会退化为单链表。

因此，我们需要某种手段来维护索引与原始链表大小之间的平衡，也就是说，如果链表结点变多了，索引值就相应地增加一些。

当我们往跳表中插入数据的时候，我们可以选择同时也将这个数据插入到部分索引层中。而插入到哪些索引层中，则由一个随机函数生成一个随机数字来决定。如果这个数字为 K，那我们就将数据插入到第一级到第 K 级索引中。

4. 为什么 Redis 要用跳表来实现有序集合而不是红黑树？

Redis 中的有序集合支持的核心操作主要有以下几个：

插入一个数据
删除一个数据
查找一个数据
按照区间查找数据
迭代输出有序序列

其中，插入、删除、查找以及迭代输出有序序列这几个操作，红黑树也可以完成，时间复杂度和跳表是一样的。

但是，按照区间查找数据这个操作，红黑树的效率没有跳表高。跳表可以在 \(O(logn)\) 时间复杂度定位区间的起点，然后在原始链表中顺序向后查询就可以了，这样非常高效。

此外，相比于红黑树，跳表还具有代码更容易实现、可读性好、不容易出错、更加灵活等优点，因此 Redis 用跳表来实现有序集合。

参考资料-极客时间专栏《数据结构与算法之美》

获取更多精彩，请关注「seniusen」!

原文地址：https://www.cnblogs.com/seniusen/p/9870398.html

时间： 2025-01-17 00:26:32

数据结构和算法之——跳表的相关文章

java数据结构与算法之顺序表与链表深入分析

转载请注明出处(万分感谢!): http://blog.csdn.net/javazejian/article/details/52953190 出自[zejian的博客] 关联文章: java数据结构与算法之顺序表与链表设计与实现分析 java数据结构与算法之双链表设计与实现 ??数据结构与算法这门学科虽然在大学期间就已学习过了,但是到现在确实也忘了不少,因此最近又重新看了本书-<数据结构与算法分析>加上之前看的<java数据结构>也算是对数据结构的进一步深入学习了,于是也就打算

C++数据结构与算法_2_线性表 --顺序表的应用示例

h2.western { font-family: "Liberation Sans",sans-serif; font-size: 16pt; }h2.cjk { font-family: "微软雅黑"; font-size: 16pt; }h2.ctl { font-family: "AR PL UMing CN"; font-size: 16pt; }h1 { margin-bottom: 0.21cm; }h1.western { fon

C++数据结构与算法_1_线性表 --顺序表的实现与分析

顺序表的实现与分析引 --线性表的抽象基类: template <typename T> class LinearList { public: LinearList(); ~LinearList(); virtual int Size() const = 0; //返回线性表所能够存储的最大长度 virtual int Length() const = 0; //当前线性表的长度 virtual int Search(T &x) const = 0; virtual int Loca

数据结构与算法之线性表

前言上一篇<数据结构和算法之时间复杂度和空间复杂度>中介绍了时间复杂度的概念和常见的时间复杂度,并分别举例子进行了一一说明.这一篇主要介绍线性表. 线性表属于数据结构中逻辑结构中的线性结构.回忆一下,数据结构分为物理结构和逻辑结构,逻辑结构分为线性结构.几何结构.树形结构和图形结构四大结构.其中,线性表就属于线性结构.剩余的三大逻辑结构今后会一一介绍. 线性表基本概念线性表(List):由零个或多个数据元素组成的有限序列. 注意: 1.线性表是一个序列. 2.0个元素构成的线性表是空表.

数据结构、算法、线性表总结

一.数据结构 1.概念 1.数据类型和抽象数据类型是不同的概念. 2.逻辑结构分为线性结构(一对一).树形结构(一对多).图形结构(多对多). 3.时间复杂度(T(n)=O(f(n)):空间复杂度(占用的内存空间). 4.算法 1.BF算法:时间复杂度最坏为O(n*m). 2.kmp算法:时间复杂度最坏为O(n+m). 二.线性表 1.概念 1.顺序表结点的存储地址计算公式:Loc(ai)=Loc(a1)+(i-1)*C. 2.操作主要是查找用顺序表,进行插入.删除操作的适合用链表. 3.存储密

python数据结构与算法——哈希表

哈希表学习笔记参考翻译自:<复杂性思考> 及对应的online版本:http://greenteapress.com/complexity/html/thinkcomplexity004.html 使用哈希表可以进行非常快速的查找操作,查找时间为常数,同时不需要元素排列有序 python的内建数据类型:字典,就是用哈希表实现的为了解释哈希表的工作原理,我们来尝试在不使用字典的情况下实现哈希表结构. 我们需要定义一个包含键->值映射的数据结构,同时实现以下两种操作: add(k

数据结构与算法--------哈希表

1.概述: 数据结构:哈希表插入时间复杂度:O(1) 删除时间复杂度:O(1) 查找时间复杂度: 优点: 哈希表的操作速度比较快,如插入.删除的时间复杂度都是常量O(1),可以在一秒内查找上千条记录哈希表的编程实现相对容易缺点: 哈希表不能被填满.哈希表被基本填满的时候,性能会急剧下降,所以为了保证性能,你一定要确保你哈希表的容量的大小是足够的哈希表到其他哈希表的数据迁移过程是一个费时的过程(如定期将数据迁移到更大的哈希表中去会很费时).如果一开始没有预估好你的数据量的大小,初始时创建的

数据结构、算法及线性表总结

思维导图重要概念数据:是能被输入进计算机中,并能被计算操作处理的对象的总称数据元素:是数据结构中讨论的基本单位数据类型:整型.浮点型.字符型等等变量所具有的不同的数据种类存储结构:又称物理结构,是描述数据具体在内存中的存储结构,分为线性结构和非线性结构逻辑结构:是描述数据之间的相互关系,分为线性结构(一对一).树形结构(一对多).图状结构/网状结构(多对多) 算法:时间复杂度表示算法执行时间与问题规模之间的关系,是对运算时间的一个大致估计:空间复杂度表示算法执行时占用的内存空间线性

数据结构与算法之----线性表

01线性表 1.线性表的判断方式就是元素有且只有一个直接前驱和直接后继,元素可以为空,此时叫做空表 2.抽象数据类型标准格式 ADT 抽象数据类型名 DATA 数据元素之间逻辑关系的定义 Operation 操作 endADT 3.操作伪代码 Operation InitList(*L): 初始化操作,建立一个空的线性表L ListEmpty(L): 判断线性表是否为空表,如果为空返回true,否则返回false ClearList(*L): 将线性表清空(实际情况不是删除元素,而是将内存中的元

猜你喜欢

asp.net中用FileStream类实现下载文件功能，自定义下载路径，像IE下载一样

方法一: //这个值可以从配置文件读取,或者放个textbox让用户填 string path = "你的路径";FileStream outputStream = new Fil ...

request请求编码处理

request用来获取浏览器的请求信息,请求的方式分为get请求和post请求. get请求会把参数显示到地址栏(超链接或通过地址栏直接请求),post请求用来提交表单. get请求的参数在url之后 ...

面经收藏的这可能不只是一篇面经

作者:_XiaoTeng_链接:https://www.nowcoder.com/discuss/29890来源:牛客网写了个显眼的标题,就真得说几句有用的话. 5月份一个很偶然的机会,加了叶神的微 ...

csharp:Dapper Sample

You can find Dapper on Google Code here: http://code.google.com/p/dapper-dot-net/ and the GitHub dis ...

centos 下编译安装mysql5.1与mysql5.5

mysql5.1.60编译安装 1.tar -zxvf mysql* 2../configure 之前要make clean ./configure --prefix=/home/shk/mysql- ...

夜夜夜

夜虽深,人未眠你,耳边飞翔天性使然还是怪我让你疯狂我,无力抵抗你却叫上伙伴,一拥而上让我痛,让我痒分一更,秒一更,身惨梦不成,我竟不作声至今时,身之穷困,独坐愁苦.夜不能寐,侧耳远听,吟 ...

Axiom3D:Ogre中Mesh网格分解成点线面。

这个需求可能比较古怪,一般Mesh我们组装好顶点,索引数据后,直接放入索引缓冲渲染就好了.但是如果有些特殊需要,如需要标注出Mesh的顶点,线,面这些信息,以及特殊显示这些信息. 最开始我想的是自己分 ...

inputstream，inputstreamreader，与reader的关系

InputStream:得到的是字节输入流,InputStream.read("filename")之后,得到字节流 Reader:读取的是字符流 InputStreamReade ...

FPGA内部动态可重置PLL讲解（二）

对于全局时钟的管理,涉及到关于亚稳态的知识,大家可以上网搜索相关资料,这里不再赘述.亚稳态最简单的理解形式是无法判断是处于高电平状态还是处于低电平状态,这样会导致整个系统不稳定,会出现逻辑上的错误. ...

学习C++，应该循序渐进的看哪些书？

在某博客上看到的一个C++书籍阅读清单,可以参考下: 阶段 1<Essential C++>这是一本内容不多但很实用的C++入门书籍,强调快速上手与理解C++编程.本书主要围绕一系列逐渐复 ...

winform跨线程问题

1.invoke是同步线程 1 using System; 2 using System.Collections.Generic; 3 using System.ComponentModel; 4 u ...

IOS的AppDelegate方法中的事件触发调用

用到的时候老是要去找,还是记下来好= = IOS中AppDelegate中的生命周期事件的调用条件: [cpp] view plaincopy //当应用程序将要进入非活动状态执行,在此期间,应用程序 ...

MySQL集群搭建（所有节点在同一台机子上）

转自:http://www.2cto.com/database/201408/328954.html 加了一些遇到的错误及其解决方法: -------------------------------- ...

习题10-3 角度和正方形 UVa1643

1.题目描述:点击打开链接 2.解题思路:本题是一道数学题.通过试验可以发现,不管第一个正方形放在哪里,第二个正方形总可以恰好放入第一个正方形和最下面那条射线之间.而且第一个正方形放的越靠上,中间围出 ...

Python3爬取中文网址

本以为Python3的中文兼容性无比友好,结果还是会有一点问题的. 解决方案如下,就以爬取我自己的一个网页极简翻译为例 #coding:utf8 import urllib.request impor ...

android-exploitme（二）：安装apk熟悉测试环境

今天我们来熟悉测试环境: 1. 下载server代码,并运行 git clone https://github.com/SecurityCompass/LabServer.git 2. 这个serve ...

技术文章-java中的IO流

1.File类 Java中对文件有操作时,可以实例化一个File对象,将文件路径利用这样的形式赋给File对象. File f = new File(filePath); File类的基本操作包括: ...

C++类库开发之导出类设计原则

导出类设计上一篇博客详细陈述了类库开发的各个知识点(http://blog.csdn.net/z702143700/article/details/45989993),本文将进一步陈述,对于类库开发 ...

实时人脸识别

今天研究了几个开源项目,纪录一下. 目标:能够实时获取到 AVCaptureSession 中实时的获取的图像数据,转换为 UIImage : 对获取的 UIImage 进行脸部识别: 最后,达到 ...

Dijkstra和Floyd_warshall

import java.util.Arrays; import java.util.Scanner; /*题目描述: 有n个城市,城市间有m条道路,每条道路都有长度d,给你起点城市s终点终点t,要求输 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.034 s.