小朋友学数据结构(11):堆排序

小朋友学数据结构(11):堆排序

(一)什么是堆

堆实际上是一棵完全二叉树,其任何一非叶节点满足性质:

Key[i]<=key[2i+1]&&Key[i]<=key[2i+2]或者

Key[i]>=Key[2i+1]&&key>=key[2i+2],

即任何一非叶节点的关键字不大于或者不小于其左右孩子节点的关键字。

堆分为大顶堆和小顶堆,满足Key[i]>=Key[2i+1]&&key>=key[2i+2]称为大顶堆,满足 Key[i]<=key[2i+1]&&Key[i]<=key[2i+2]称为小顶堆。由上述性质可知大顶堆的堆顶的关键字肯定是所有关键字中最大的,小顶堆的堆顶的关键字是所有关键字中最小的。

(二)堆排序思想

利用大顶堆(小顶堆)堆顶记录的是最大关键字(最小关键字)这一特性,使得每次从无序中选择最大记录(最小记录)变得简单。

以大顶堆为例,其基本思想为:

a)将初始待排序关键字序列(R1,R2....Rn)构建成大顶堆,此堆为初始的无序区;

b)将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,......Rn-1)和新的有序区(Rn),且满足R[1,2...n-1]<=R[n];

c)由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……,Rn-1)调整为新堆,然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2....Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。

(三)操作过程

a)初始化堆:将R[1..n]构造为堆;

b)将当前无序区的堆顶元素R[1]同该区间的最后一个记录交换,然后将新的无序区调整为新的堆。

因此对于堆排序,最重要的两个操作就是构造初始堆和调整堆,其实构造初始堆事实上也是调整堆的过程,只不过构造初始堆是对所有的非叶节点都进行调整。

(四)例子和代码

针对两步操作过程,咱们以整形数组a[]={16,7,3,20,17,8}为例。

a)第一步是构造初始堆:

首先根据该数组元素构建一个完全二叉树,得到

4-1.jpg

然后需要构造初始堆,则从最后一个非叶节点开始调整,调整过程如下:

4-2.jpg

4-3.jpg

4-4.jpg

上图中因为16,7,17三个节点不满足堆的性质,因此需要重新调整如下图:

4-5.jpg

这样就得到了初始堆。

上面的过程实际上就是每次调整都是从父节点、左孩子节点、右孩子节点三者中选择最大者跟父节点进行交换,交换之后可能造成被交换的孩子节点不满足堆的性质,因此每次交换之后要重新对被交换的孩子节点进行调整。

整个过程的实现代码如下:

#include <stdio.h>

void HeapAdjust(int *a,int i,int size)  //调整堆
{
    // 如果i是叶子 节点就不用进行调整
    if(i >= size/2)
    {
        return;
    }

    // i非叶子节点,开始调整
    int lchild = 2 * i + 1;     // i的左孩子节点序号
    int rchild = 2 * i + 2;     // i的右孩子节点序号
    int max = i;                // 临时变量
    if(lchild < size && a[lchild] > a[max])
    {
        max = lchild;
    }
    if(rchild < size && a[rchild] > a[max])
    {
        max = rchild;
    }
    if(max != i)
    {
        // 将a[i]与a[max]对换
        a[i]   = a[i] ^ a[max];
        a[max] = a[i] ^ a[max];
        a[i]   = a[i] ^ a[max];

        // 若调整之后以max为父节点的子树不是堆,则对该子树继续调整
        HeapAdjust(a, max, size);
    }
}

void BuildHeap(int *a,int size)
{
    for(int i = size/2 - 1; i >= 0; i--)    //非叶节点最大序号值为size/2
    {
        HeapAdjust(a, i, size);
    }
}

int main(int argc, const char * argv[])
{
    int a[] = {16, 7, 3, 20, 17, 8};
    int size = sizeof(a) / sizeof(int);
    BuildHeap(a, size);     // 建立堆

    printf("构造出初始堆");
    for(int i = 0; i < size; i++)
    {
        printf("%d ", a[i]);
    }

    return 0;
}

运行结果:

构造出初始堆  20 17 8 7 16 3

b)有了初始堆之后,就可以进行排序

4-6.jpg

此时3位于堆顶不满足堆的性质需要继续调整:

4-7.jpg

调整后,3、7、16这个子堆不满足堆的性质,继续调整:

4-8.jpg

这样经过第一轮调整后,得到了一个有序数组{20}和一个调整后的堆。下面继续调整:

4-9.jpg

4-10.jpg

4-11.jpg

这样经过第二轮调整后,得到一个有序数组{17,20}和一个调整后的堆。继续调整:

4-12.jpg

4-13.jpg

这样经过第三轮调整后,得到一个有序数组{16,17,20}和一个调整后的堆。继续调整:

4-14.jpg

4-15.jpg

这样经过第四轮调整后,得到一个有序数组{8,16,17,20}和一个调整后的堆。继续调整:

4-16.jpg

这样经过第五轮调整后,得到一个有序数组{7,8,16,17,20}和一个调整后的堆,这个堆只有一个元素,且一定是整个数组中的最小值,所以不用调整。

由上述过程可知,总共需要调整5轮,即sizeof(数组)-1轮。

下面给出实现的代码:

#include <stdio.h>

void HeapAdjust(int *a,int i,int size)  //调整堆
{
    // 如果i是叶子 节点就不用进行调整
    if(i >= size/2)
    {
        return;
    }

    // i非叶子节点,开始调整
    int lchild = 2 * i + 1;     // i的左孩子节点序号
    int rchild = 2 * i + 2;     // i的右孩子节点序号
    int max = i;                // 临时变量
    if(lchild < size && a[lchild] > a[max])
    {
        max = lchild;
    }
    if(rchild < size && a[rchild] > a[max])
    {
        max = rchild;
    }
    if(max != i)
    {
        // 将a[i]与a[max]对换
        a[i]   = a[i] ^ a[max];
        a[max] = a[i] ^ a[max];
        a[i]   = a[i] ^ a[max];

        // 若调整之后以max为父节点的子树不是堆,则对该子树继续调整
        HeapAdjust(a, max, size);
    }
}

void BuildHeap(int *a,int size)
{
    for(int i = size/2 - 1; i >= 0; i--)    //非叶节点最大序号值为size/2
    {
        HeapAdjust(a, i, size);
    }
}

void HeapSort(int *a,int size)    //堆排序
{
    BuildHeap(a, size);
    for(int i = size - 1; i > 0; i--)
    {
        // 交换堆顶和最后一个元素,即每次将剩余元素中的最大者放到最后面
        a[i] = a[i] ^ a[0];
        a[0] = a[i] ^ a[0];
        a[i] = a[i] ^ a[0];
        HeapAdjust(a, 0, i);      //重新调整堆顶节点成为大顶堆
    }
}

int main(int argc, const char * argv[])
{
    int a[] = {16, 7, 3, 20, 17, 8};
    int size = sizeof(a) / sizeof(int);
    HeapSort(a, size);     // 堆排序

    printf("堆排序后的结果 ");
    for(int i = 0; i < size; i++)
    {
        printf("%d ", a[i]);
    }

    return 0;
}

运行结果:

堆排序后的结果 3 7 8 16 17 20

(五) 进一步分析

从上述过程可知,堆排序其实也是一种选择排序,是一种树形选择排序。只不过直接选择排序中,为了从R[1...n]中选择最大记录,需比较n-1次,然后从R[1...n-2]中选择最大记录需比较n-2次。事实上这n-2次比较中有很多已经在前面的n-1次比较中已经做过,而树形选择排序恰好利用树形的特点保存了部分前面的比较结果,因此可以减少比较次数。对于n个关键字序列,最坏情况下每个节点需比较log2(n)次,因此其最坏情况下时间复杂度为nlogn。堆排序为不稳定排序,不适合记录较少的排序。

原文地址:https://www.cnblogs.com/alan-blog-TsingHua/p/9607599.html

时间: 2024-10-02 19:42:24

小朋友学数据结构(11):堆排序的相关文章

小朋友学数据结构(4):归并排序

小朋友学数据结构(4):归并排序 (一)基本思想 归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的.然后再把有序子序列合并为整体有序序列. 7-1.jpg (二)代码实现 import java.util.Arrays; public class Sort { public static void mergeSort(int[] array) { sort(array, 0, array.length - 1); } p

小朋友学数据结构(10):基数排序

小朋友学数据结构(10):基数排序 一.基本思想 将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零.然后,从最低位(即个位数)开始,依次进行一次排序.这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列. 与其他排序不同的是,基数排序不涉及数的交换. 基数排序是一种稳定的排序算法. 8.png 二.主要步骤 从上面的计算过程,咱们可以看出,基数排序主要有三个步骤: 1.把所有元素都分配到相应的桶中(因为整数每位数有0~9共十种可能,所以通常需要10个桶) 2.把

小朋友学数据结构(8):直接插入排序

小朋友学数据结构(8):直接插入排序 (一)基本思想 在要排序的一组数中,假设前面(n-1)[n>=2] 个数已经是排好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数也是排好顺序的.如此反复循环,直到全部排好顺序. 1-1.jpg (二)C语言代码实现 #include<stdio.h> void insertSort(int a[], int n) { int i, j, temp; for (i = 1; i < n; i++) { temp = a[i]; j =

小朋友学数据结构(3):二叉树的建立和遍历

小朋友学数据结构(3):二叉树的建立和遍历 一.基本概念 BinaryTree.png 二叉树:每个结点的子结点个数不大于2的树,叫做二叉树. 根结点:最顶部的那个结点叫做根结点,根结点是所有子结点的共同祖先.比如上图中的"7"结点就是根结点. 子结点:除了根结点外的结点,都叫子结点. 叶子结点:没有子结点的结点,叫做叶子结点.比如上图中的"1"结点."5"结点和"11"结点. 二叉树的遍历,有三种: (1)前序遍历:先遍历根

小朋友学数据结构(2):栈

小朋友学数据结构(2):栈 栈是一种先入后出的数据结构. 如下图所示,入栈的顺序为1.2.3:出栈的顺序则反过来:3.2.1. stack.png 可以想象往一个箱子里放书,先放进去的书必然在箱子的底部,最后放进去的书在箱子的顶部.拿书的时候则要先拿顶部(后放进去)的书,最先放进去的书最后才能拿出来. 栈可以用链表来实现: #include<iostream> using namespace std; struct node //定义栈的结点结构 { int data; node *next;

小朋友学数据结构(5):顺序查找法

小朋友学数据结构(5):顺序查找法 查找是最常见的数据操作之一,也是数据结构的核心运算之一,其重要性不言而喻. 顺序查找是最简单的查找策略,对于小规模的数据,顺序查找是个不错的选择. (一)基本思想 从数据的第一个元素开始,依次比较,直到找到目标数据或查找失败. 1 从表中的第一个元素开始,依次与关键字比较. 2 若某个元素匹配关键字,则查找成功. 3 若查找到最后一个元素还未匹配关键字,则查找失败. 1.png (二)时间复杂度 顺序查找平均关键字匹配次数为表长的一半,其时间复杂度为O(n).

小朋友学数据结构(7):快速排序

小朋友学数据结构(7):快速排序 一.快速排序 (一)基本思想 选择一个基准元素,通常选择第一个元素或者最后一个元素,通过一趟扫描,将待排序列分成两部分,一部分比基准元素小,一部分大于等于基准元素,此时基准元素在其排好序后的正确位置,然后再用同样的方法递归地排序划分的两部分. (二)例子 6-1.png 以{5, 9, 2, 7 ,8, 3, 6, 1, 4, 0}为例. 选择第0个元素5作为参照数,咱们第一步的目标是把比5小的数都调整到5的左边,比5大的数都调到5的右边. (1)从左往右开始观

小朋友学数据结构(9):希尔排序

小朋友学数据结构(9):希尔排序 (一)基本思想 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序:随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止. (二)例子 有一个数组,其原始数组为: 2-1.png 取初始增量gap = length / 2 = 5,这样就将整个数组分为5组(每组用相同的颜色表示) 2-2.png 将这5组的数据分别按由小到大的顺序排列,结果为 2-3.png 缩小增量gap = gap / 2 = 2,整

小朋友学数据结构(6):折半查找法

小朋友学数据结构(6):折半查找法 折半查找法又称为二分查找法. (一)基本思想 假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功:否则利用中间位置记录将表分成前.后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表. 重复以上过程,直到找到满足条件的记录,此时查找成功:或直到子表不存在为止,此时查找不成功. 2.png (二)时间复杂度 二分查找的基本思想是将n个元素分成大致相等的两部分,取a[n/2]与x