二叉堆 及 大根堆的python实现

Python

二叉堆(binary heap)

二叉堆是一种特殊的堆,二叉堆是完全二叉树或者是近似完全二叉树。二叉堆满足堆特性:父节点的键值总是保持固定的序关系于任何一个子节点的键值,且每个节点的左子树和右子树都是一个二叉堆。

当父节点的键值总是大于或等于任何一个子节点的键值时为最大堆。 当父节点的键值总是小于或等于任何一个子节点的键值时为最小堆。

二叉堆的存储

二叉堆一般用数组来表示。如果根节点在数组中的位置是1,第n个位置的子节点分别在2n和 2n+1。因此,第1个位置的子节点在2和3,第2个位置的子节点在4和5。以此类推。这种基于1的数组存储方式便于寻找父节点和子节点。

如果存储数组的下标基于0,那么下标为i的节点的子节点是2i + 1与2i + 2;其父节点的下标是?floor((i ? 1) ∕ 2)?, 函数floor(x), 其功能是“向下取整”,或者说“向下舍入”,即取不大于x的最大整数(与“四舍五入”不同,下取整是直接取按照数轴上最接近要求值的左边值,即不大于要求值的最大的那个值)。比如floor(1.1),floor(1.9)都是返回1。

如下图的两个堆:

将这两个堆保存在以1开始的数组中:

位置: 1 2 3 4 5 6 7 8 9 10 11

左图: 1 2 3 4 5 6 7 8 9 10 11

右图: 11 9 10 5 6 7 8 1 2 3 4

对于一个很大的堆,这种存储是低效的。因为节点的子节点很可能在另外一个内存页中。B-heap是一种效率更高的存储方式,把每个子树放到同一内存页。

如果用指针链表存储堆,那么需要能访问叶节点的方法。可以对二叉树“穿线”(threading)方式,来依序遍历这些节点。

基本操作

插入节点

在数组的最末尾插入新节点。然后自下而上调整子节点与父节点(称作up-heap或bubble-up, percolate-up, sift-up, trickle up, heapify-up, cascade-up操作):比较当前节点与父节点,不满足堆性质则交换。从而使得当前子树满足二叉堆的性质。时间复杂度为O(log n)。

删除节点

删除根节点用于堆排序。

对于最大堆,删除根节点就是删除最大值;对于最小堆,是删除最小值。然后,把堆存储的最后那个节点移到填在根节点处。再从上而下调整父节点与它的子节点:对于最大堆,父节点如果小于具有最大值的子节点,则交换二者。这一操作称作down-heap或bubble-down, percolate-down, sift-down, trickle down, heapify-down, cascade-down,extract-min/max等。直至当前节点与它的子节点满足堆性质为止。

构造二叉堆

一个直观办法是从单节点的二叉堆开始,每次插入一个节点。其时间复杂度为 {\displaystyle O(n\log n)} O(n\log n)。

最优算法是从一个节点元素任意放置的二叉树开始,自底向上对每一个子树执行删除根节点时的Max-Heapify算法(这是对最大堆而言)使得当前子树成为一个二叉堆。具体而言,假设高度为h的子树均已完成二叉堆化,那么对于高度为h+1的子树,把其根节点沿着最大子节点的分枝做调整,最多需要h步完成二叉堆化。可以证明,这个算法的时间复杂度为O(n)。

代码

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""

@author: gsharp
"""

class BinaryHeap:
    def __init__(self, n):
        self.heap = [0] * n
        self.size = 0

    def remove_min(self):
        removed = self.heap[0]
        self.size -= 1
        self.heap[0] = self.heap[self.size]
        self._down(0)
        return removed

    def add(self, value):
        self.heap[self.size] = value
        self._up(self.size)
        self.size += 1

    def _up(self, pos):
        while pos > 0:
            parent = (pos - 1) // 2
            if self.heap[pos] >= self.heap[parent]:
                break
            self.heap[pos], self.heap[parent] = self.heap[parent], self.heap[pos]
            pos = parent

    def _down(self, pos):
        while True:
            child = 2 * pos + 1
            if child >= self.size:
                break
            if child + 1 < self.size and self.heap[child + 1] < self.heap[child]:
                child += 1
            if self.heap[pos] <= self.heap[child]:
                break
            self.heap[pos], self.heap[child] = self.heap[child], self.heap[pos]
            pos = child

def test():
    h = BinaryHeap(10)
    h.add(5)
    h.add(7)
    h.add(9)
    h.add(4)
    h.add(3)
    print(h.heap)
    h.add(1)
    print(h.heap)
    h.add(2)
    print(h.heap)
    print(h.remove_min())
    print(h.remove_min())
    print(h.remove_min())

test()

原文地址:https://www.cnblogs.com/sonnet/p/8996968.html

时间: 2024-08-24 21:37:49

二叉堆 及 大根堆的python实现的相关文章

PAT树_层序遍历叶节点、中序建树后序输出、AVL树的根、二叉树路径存在性判定、奇妙的完全二叉搜索树、最小堆路径、文件路由

<pre class="code"><span style="font-family: %value; font-size: 14px;">03-树1. List Leaves (25) Given a tree, you are supposed to list all the leaves in the order of top down, and left to right. Input Specification: Each inpu

【暖*墟】 #二叉堆# 大根堆的常见操作

一.二叉堆的定义 二叉堆使用完全二叉树(其前n-1层必须被填满,第n层也要从左到右顺序填满)来实现. 在二叉堆中,所有非终端结点的值均不大于(或不小于)其左右孩子的值. 若非终端结点的值均不大于其左右孩子结点的值,这样的二叉堆叫做小根堆(下图b), 小根堆根结点的值是该堆中所有结点的最小值: 同样的,若非终端结点的值都不小于其左右孩子的值,这样的堆叫做大根堆(下图a), 大根堆根结点的值为改堆所有结点的最大值.利用堆的此性质,可以实现堆排序. 说明:小根堆和大根堆的实现没有太大的区别,所以下面以

浅析基础数据结构-二叉堆

如题,二叉堆是一种基础数据结构 事实上支持的操作也是挺有限的(相对于其他数据结构而言),也就插入,查询,删除这一类 对了这篇文章中讲到的堆都是二叉堆,而不是斜堆,左偏树,斐波那契堆什么的 我都不会啊 一.堆的性质 1.堆是一颗完全二叉树 2.堆的顶端一定是“最大”,最小”的,但是要注意一个点,这里的大和小并不是传统意义下的大和小,它是相对于优先级而言的,当然你也可以把优先级定为传统意义下的大小,但一定要牢记这一点,初学者容易把堆的“大小”直接定义为传统意义下的大小,某些题就不是按数字的大小为优先

集训队7月31日(二叉堆和哈曼夫树)

今天上午学习了二叉堆和哈曼夫树,算法竞赛指南80~92页. 先说一下我对二叉堆和哈曼夫树的理解,二叉堆分为大根堆,小根堆,而哈曼夫树就是二叉堆的一种表现形式,在解决一些权值带深度的一些问题上是一个良好的思路,简而言之,这两个东西可以表示为维护一个优先队列. 学了这两个知识,写了三个题. 1.二叉堆+贪心+链表 https://www.cnblogs.com/2462478392Lee/p/11279484.html多校 2.哈夫曼树 https://www.cnblogs.com/2462478

【转】二叉堆与优先队列

目录 1.插入 2.删除 3.查询 1.堆排序 2.用两个堆来维护一些查询第k小/大的操作 中位数 3.利用堆来维护可以“反悔的贪心” 如题,二叉堆是一种基础数据结构 事实上支持的操作也是挺有限的(相对于其他数据结构而言),也就插入,查询,删除这一类 对了这篇文章中讲到的堆都是二叉堆,而不是斜堆,左偏树,斐波那契堆什么的 我都不会啊 更新概要: 无良博主终于想起来要更新辣 upd1:更新5.2.2-对于该子目所阐述的操作“用两个堆来维护一些查询第k小/大的操作”更新了一道例题-该操作对于中位数题

二叉堆,优先队列,二叉树的理解

1. 二叉堆是完全二叉树,即它的N级子节点放慢之后才会去放N+1级子节点 2. 二叉堆用数组实现,每个子节点通过固定的索引找到(由完全二叉树保证) 3. 二叉堆排序只保证堆顶有效,即堆顶是最大值或最小值,是优先队列实现的不二选择 4. 二叉堆删除节点,需要重新组织堆内结构,不太高效 5. 二叉树,也叫二叉搜索树,用关系型容器实现,适用于普通的查找,排序

大根堆的创建过程

初始堆就是大根堆,只是是第一次(初始序列)调整,第一次必须是自底向上逐个调整,以后(第一次交换后)是自上向下调整(因为除了第一个即堆顶元素,其他都是已经调整好的堆).过程:先把数据画出一颗二叉树:                     40           30                92    16         20     47       25 56   55  35从最后一个数据的双亲(20)开始,数据最大的成为双亲20和35交换:下一个双亲(16),16和56交换:双

bzoj 1577: [Usaco2009 Feb]庙会捷运Fair Shuttle——小根堆+大根堆+贪心

Description 公交车一共经过N(1<=N<=20000)个站点,从站点1一直驶到站点N.K(1<=K<=50000)群奶牛希望搭乘这辆公交车.第i群牛一共有Mi(1<=Mi<=N)只. 他们希望从Si到Ei去.公交车只能座C(1<=C<=100)只奶牛.而且不走重复路线,请计算这辆车最多能满足多少奶牛听要求.注意:对于每一群奶牛,可以部分满足,也可以全部满足,也可以全部不满足. Input 第1行: 三个整数: K,N,C. 由空格隔开. 第2..

温故知新,基础复习(二叉堆排序)

温故知新,基础复习(二叉堆排序) 最小堆(最终数组的数据是降序),最大堆(最终数组的数据是升序) 下例是最小堆 #include <stdio.h> #include <stdlib.h> void Swap(int Arra[],unsigned int LeftIndex,unsigned int RightIndex) { int TeampValue = Arra[LeftIndex]; Arra[LeftIndex]=Arra[RightIndex]; Arra[Righ