“跳跃表”简析

复杂度

  1. 空间复杂度: O(n) (期望)
  2. 跳跃表高度: O(logn)(期望)
  3. 查找:O(logn)(期望)
  4. 插入: O(logn)(期望)
  5. 删除:O(logn)(期望)

之所以在每一项后面都加一个“期望”,是因为跳跃表的复杂度分析是基于概率论的。有可能会产生最坏情况,不过这种概率极其微小。

  • 顶层链表元素的确定方式

底层链表就是最初的链表,包含所有元素。

we just like every node to be accessed sort of as quickly as possible, uniformly
我们只希望尽可能的访问每一个节点尽可能的快。那么什么样的元素应该添加进上层链表。

我的理解就是均匀的让底层元素出现在上层链表中。

在第一个上层链表中,其隔一个挑选了一个元素作为上层链表的元素。如此来满足均匀的要求,进而满足了尽可能快的访问到每一个元素。

  • 到底需要多少条额外的链表最合适?

由于访问速度是 k 乘以开k次方的n,所以为了 让这个数值最低,那么k取LogN最好。而这个logN很像二叉排序树的高度,那么大家都有感觉,就是这个跳跃链查找过程越来越像折半查找。所以这logN的取法,以这样的方式还是很容易让我明白的。

  • 查找的过程和复杂度

由于我们已经确定了有多少个链表,所以来完整的走一遍查找某个元素的过程,那么就非常清楚其复杂度了。

如下图所示:

  • 最右边的蓝线代表负无穷
  • 当然我们要查找45时,每一根红线代表我们查找的路径
  • 横着代表比较了一下,竖着代表走向下层链表
  • 我们可以认为刚开始有一个指针指着左上方的负无穷

  1. 从最上层的链表开始,第一个遇到的数是88,那么45在88之间,比较了一次,45小于88,所以走向下层链表。
  2. 45与23相比,大于23,那么再与88比较,发现小于88,所在在23处向下走
  3. 45与36相比,发现大于36,所以现在指针指36,再45与88比,又小了,所以在36处向下走
  4. 45与67比,发现小了,那么在36处向下走。
  5. 在底层链表与45比,发现一样,ok,找到了。

这就是查找过程,一共经历了移动了7次比较,挪动了4次指针。此时的需要的额外的链表为4个,加上底层链表一共是5个链表。
其中,注意比较次数,在每一条链表上我们可以发现最多比较两次,至少比较一次,所以比较次数不会超过 2LogN。

所以比较的时间复杂度是 O(logN)。

跳跃表的查找

目的:在跳跃表中查找一个元素x

在跳跃表中查找一个元素x,按照如下几个步骤进行:

i) 从最上层的链(Sh)的开头开始

ii) 假设当前位置为p,它向右指向的节点为q(p与q不一定相邻),且q的值为y。将y与x作比较

(1) x=y 输出查询成功及相关信息

(2) x>y 从p向右移动到q的位置

(3) x<y 从p向下移动一格

iii) 如果当前位置在最底层的链中(S0),且还要往下移动的话,则输出查询失败

插入

目的:向跳跃表中插入一个元素x

首先明确,向跳跃表中插入一个元素,相当于在表中插入一列从S0中某一位置出发向上的连续一段元素。有两个参数需要确定,即插入列的位置以及它的“高度”。

关于插入的位置,我们先利用跳跃表的查找功能,找到比x小的最大的数y。根据跳跃表中所有链均是递增序列的原则,x必然就插在y的后面。

而插入列的“高度”较前者来说显得更加重要,也更加难以确定。由于它的不确定性,使得不同的决策可能会导致截然不同的算法效率。为了使插入数据之后,保持该数据结构进行各种操作均为O(logn)复杂度的性质,我们引入随机化算法(Randomized Algorithms)。

我们定义一个随机决策模块,它的大致内容如下:

•产生一个0到1的随机数r                r ← random()
•如果r小于一个常数p,则执行方案A,        if  r<p    then do A
  否则,执行方案B                          else do B

初始时列高为1。插入元素时,不停地执行随机决策模块。如果要求执行的是A操作,则将列的高度加1,并且继续反复执行随机决策模块。直到第i次,模块要求执行的是B操作,我们结束决策,并向跳跃表中插入一个高度为i的列。

根据上述决策方法,该列的高度大于等于k的概率为pk-1

此处有一个地方需要注意,如果得到的i比当前跳跃表的高度h还要大的话,则需要增加新的链,使得跳跃表仍满足先前所提到的条件。

我们来看一个例子:

假设当前我们要插入元素“40”,且在执行了随机决策模块后得到高度为4

·步骤一:找到表中比40小的最大的数,确定插入位置

·步骤二:插入高度为4的列,并维护跳跃表的结构

删除

目的:从跳跃表中删除一个元素x

删除操作分为以下三个步骤:

(1) 在跳跃表中查找到这个元素的位置,如果未找到,则退出

(2) 将该元素所在整列从表中删除

(3) 将多余的“空链”删除

我是天王盖地虎的分割线

参考:http://blog.csdn.net/zy825316/article/details/22600003

参考:http://wenku.baidu.com/link?url=QqqF4KGLMlfxjoqnzKsGkkuJ9EjpHdbC7xaylHrezc37YF54xyt2YDVKJi7W1sMXsm5fAzeItdnIBKMtOUSQ-QUBNMAx_142JSbgwCpM-jO

时间: 2024-10-13 10:22:07

“跳跃表”简析的相关文章

跳跃表skiplist简析

1.简述 跳跃表(skiplist)最初由William Pugh发表在ACM通讯上的论文<Skip lists: a probabilistic alternative to balanced trees >中,作者给出的定义是:跳表是在很多应用中有可能替代平衡树而作为实现方法的一种数据结构.跳跃列表的算法有同平衡树一样的渐进的预期时间边界,并且更简单.更快速和使用更少的空间.其实,跳表,顾名思义,跳跃的链表,跳表在链表的基础上增加了前向指针,对于链表而言,顺序查找的时间复杂度为线性时间,为

Java Annotation 及几个常用开源项目注解原理简析

PDF 版: Java Annotation.pdf, PPT 版:Java Annotation.pptx, Keynote 版:Java Annotation.key 一.Annotation 示例 Override Annotation Java 1 2 3 @Override public void onCreate(Bundle savedInstanceState); Retrofit Annotation Java 1 2 3 @GET("/users/{username}&quo

简析一下SQL Server里面Fast_Forword 和 SRROLL 的区别

原文:简析一下SQL Server里面Fast_Forword 和 SRROLL 的区别 这次简单说说游标的分类. 先看看通常游标的语法 DECLARE cursor_name CURSOR [ LOCAL :局部游标,仅在当前会话有效 | GLOBAL : 全局游标,全局有效,可以 ] [ FORWARD_ONLY :只能向前游标,读取游标时只能使用 Next 谓词 | SCROLL :滚动游标,FIRST.LAST.PRIOR.NEXT.RELATIVE.ABSOLUTE 都可以使用 ] [

浅析SkipList跳跃表原理及代码实现

本文将总结一种数据结构:跳跃表.前半部分跳跃表性质和操作的介绍直接摘自<让算法的效率跳起来--浅谈“跳跃表”的相关操作及其应用>上海市华东师范大学第二附属中学 魏冉.之后将附上跳跃表的源代码,以及本人对其的了解.难免有错误之处,希望指正,共同进步.谢谢. 跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找.插入.删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领.而且最重要的一点,就是它的编程复杂度较同类的AVL树,红黑树等要低得多,这使得其

JDK框架简析--java.lang包中的基础类库、基础数据类型

题记 JDK.Java Development Kit. 我们必须先认识到,JDK不过,不过一套Java基础类库而已,是Sun公司开发的基础类库,仅此而已,JDK本身和我们自行书写总结的类库,从技术含量来说.还是在一个层级上,它们都是须要被编译成字节码.在JRE中执行的,JDK编译后的结果就是jre/lib下的rt.jar,我们学习使用它的目的是加深对Java的理解,提高我们的Java编码水平. 本系列全部文章基于的JDK版本号都是1.7.16. 源代码下载地址:https://jdk7.jav

Android -- MediaPlayer内部实现简析

Android -- MediaPlayer内部实现简析 在之前的博客中,已经介绍了使用MediaPlayer时要注意的内容.现在,这里就通过一个MediaPlayer代码实例,来进一步分析MediaPlayer内部是如何运作.实现的:当然这里的分析只截止到底层调用播放器之前,因为播放器这块实在是没搞懂. 我们使用的例子来源于之前MediaPlayer Playback译文中的官方实例: String url = "http://........"; // your URL here

简析 .NET Core 构成体系

简析 .NET Core 构成体系 Roslyn 编译器 RyuJIT 编译器 CoreCLR & CoreRT CoreFX(.NET Core Libraries) .NET Core 代码开发.部署.运行过程 总结 前文介绍了.NET Core 在整个.NET 平台所处的地位,以及与.NET Framework的关系(原文链接),本文将详细介绍.NET Core 框架的构成和各模块主要功能,以及如何实现跨平台. 上图描述了 .NET Core的系统构成,最上层是应用层,是开发基于UI应用的

简析Spring MVC 数据解析

简析Spring MVC 数据解析 特别说明:本文使用spring 版本为 4.1.3 常用数据提交方式: 1. form 表单提交数据 1.1 解析form表单数据(无图片等数据) 前端代码事例: <form action="test/entity" method="post"> 用户ID:<input type="text" name="userid"/><br> 用户名:<inp

三层架构—简析

三层学习完了,第一次验收的时候,自己理解的也不是很到位,后来又重新敲了一遍登陆例子,查阅了一些资料 进行第二次验收才感觉清晰了许多.之前画时序图时我就想过时序图基本上也是很好的体现了三层,当时也和别人讨 论过这个问题.直到学完三层后,更加证明了这一点. 下面我将从理论和实践两个角度总结一下三层. 理论篇 为什么使用三层架构? 说白了,分层的目的是想将复杂问题简单化,也就是面向对象技术所崇尚的"高内聚,低耦合".当业务复杂到 一定程度,数据存储在独立的存储介质时适合用三层架构. 什么是三