参考博客:常用排序算法总结(二)
计数排序 counting sort
1.计数排序是一种非常快捷的稳定性强的排序方法,时间复杂度O(n+k),其中n为要排序的数的个数,k为要排序的数的组大值。计数排序对一定量的整数排序时候的速度非常快,一般快于其他排序算法。但计数排序局限性比较大,只限于对整数进行排序。计数排序是消耗空间发杂度来获取快捷的排序方法,其空间发展度为O(K)同理K为要排序的最大值。
2.计数排序的基本思想为一组数在排序之前先统计这组数中其他数小于这个数的个数,则可以确定这个数的位置。例如要排序的数为 7 4 2 1 5 3 1 5;则比7小的有7个数,所有7应该在排序好的数列的第八位,同理3在第四位,对于重复的数字,1在1位和2位(暂且认为第一个1比第二个1小),5和1一样位于6位和7位。
计数排序非常基础,他的主要目的是对整数排序并且会比普通的排序算法性能更好。例如,输入{1, 3, 5, 2, 1, 4}给计数排序,会输出{1, 1, 2, 3, 4, 5}。这个算法由以下步骤组成:
初始化一个计数数组,大小是输入数组中的最大的数。
遍历输入数组,遇到一个数就在计数数组对应的位置上加一。例如:遇到5,就将计数数组第五个位置的数加一。
把计数数组直接覆盖到输出数组(节约空间)。
时间复杂度:O(n)
统计一个列表内每个元素出现的个数。用于小规模范围内计算!
弊端:
有限定!为排序需要新建一个列表,开辟一块内存空间,而且这个空间的大小取决于排序列表的最大值。
如果一个要排序的列表中仅有,【1,10000】这两个数,那么我们统计的话,创建的用于计数的列表就要开一一个可以存放10000个数的内存空间。这样导致的结果就是,其他的数无用并且损耗性能,时间复杂度没变但是空间复杂度增加了!这也间接的暴露了范围取值的弊端。
算法实现:
def count_sort(li, maxnum=100): """ 新建一个列表,往列表内写值 :param li: :param maxnum: :return: """ count = [0 for i in range(maxnum+1)] #创建用以计数的所有元素都是0的列表, result = [] for i in li: #遍历要计数的列表,每个元素对应的索引位置的数加1 count[i] += 1 for num, count in enumerate(count): #对已经完成计数的列表进行枚举打印,格式(数字,次数) for i in range(count): #再通过次数创建一个循环,出现多少次就把对应的数写入列表多少次 result.append(num) def count_sorts(li, max_num): """ 仅在当前列表下操作,按照次数重写列表 :param li: :param max_num: :return: """ count = [0 for i in range(max_num + 1)] for num in li: count[num] += 1 i = 0 for num,m in enumerate(count): for j in range(m): li[i] = num i += 1 return li li = [3,4,1,2,5,6,6,5,4,3,3] print(count_sorts(li,max(li)))
应用:
有一个数组[3,4,1,2,5,6,6,5,4,3,3]请写一个函数,找出该数组中没有重复的数的总和(上面的没有重复数的总和为 1+2=3)。
def count_sorts(li, max_num): """ 计数排序引申,求和 :param li: 传入的列表 :param max_num:列表中最大值 :return:和 sums """ counts = [0 for i in range(max_num + 1)] for num in li: counts[num] += 1 sums = 0 for num,count in enumerate(counts): # print(num,count) #打印列表内对应数字出现的次数 if count == 1: sums += num return sums li = [3,4,1,2,5,6,6,5,4,3,3] print(count_sorts(li,max(li)))