s11d27 算法

一、理论

1.1 时间复杂度和空间复杂度的理论:

1）空间复杂度:

是程序运行所以需要的额外消耗存储空间,一般的递归算法就要有o(n)的空间复杂度了,

简单说就是递归集算时通常是反复调用同一个方法，递归n次，就需要n个空间。

2）时间复杂度

一个算法花费的时间与算法中语句的执行次数成正比例，哪个算法中语句执行次数多，它花费时间就多。

算法的基本操作重复执行的次数是模块n的某一个函数f（n），因此，算法的时间复杂度记做：T（n）=O（f（n））。

随着模块n的增大，算法执行的时间的增长率和f（n）的增长率成正比，所以f（n）越小，算法的时间复杂度越低，算法的效率越高。

1.2 函数调用的时间复杂度分析

按数量级递增排列，常见的时间复杂度有：

常数阶O(1), 对数阶O(log2n), 线性阶O(n), 线性对数阶O(nlog2n), 平方阶O(n^2)，立方阶O(n^3),...， k次方阶O(n^k), 指数阶O(2^n)

常用的时间复杂度所耗费的时间从小到大依次是：O(1)<O(log2n)<O(n)<O(nlog2n)<O(n^2)<O(n^3)<O(2^n)<O(n!)<O(n^n)

常用的算法的时间复杂度和空间复杂度

排序法	平均时间复杂度	说明	稳定度	空间复杂度	备注
冒泡排序	O(n2)	将待排序的元素看作是竖着排列的“气泡”，较小的元素比较轻，从而要往上浮	稳定	O(1)
快速排序	O(n*log2n)	先选择中间值，然后把比它小的放在左边，大的放在右边（具体的实现是从两边找，找到一对后交换）。然后对两边分别使用这个过程（递归）。	不稳定	O(log2n)~O(n) 因为用到了递归！
选择排序	O(n2)	首先在未排序序列中找到最小元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小元素，然后放到排序序列末尾。以此递归。	稳定	O(1)
插入排序	O(n2)	逐一取出元素，在已经排序的元素序列中从后向前扫描，放到适当的位置	稳定	O(1)	起初，已经排序的元素序列为空
堆排序	O(n*log2n)	利用堆（heaps）这种数据结构来构造的一种排序算法。堆是一个近似完全二叉树结构，并同时满足堆属性：即子节点的键值或索引总是小于（或者大于）它的父节点。	不稳定	O(1)	近似完全二叉树
希尔排序	O	选择一个步长(Step) ,然后按间隔为步长的单元进行排序.递归,步长逐渐变小,直至为1.	不稳定	O(1)
箱排序	O(n)	设置若干个箱子，把关键字等于 k 的记录全都装入到第k 个箱子里 ( 分配 ) ，然后按序号依次将各非空的箱子首尾连接起来 ( 收集 ) 。		O(1)	分配排序的一种：通过" 分配 " 和 " 收集 " 过程来实现排序。

当一个算法的空间复杂度为一个常量，即不随被处理数据量n的大小而改变时，可表示为O(1)

访问数组中的元素是常数时间操作，一个算法如果能在每个步骤去掉一半数据元素，如二分检索，通常它就取 O(logn)时间。

二、查找算法

2.1 两分法

aList = [1, 2, 3, 4, 5, 6, 7, 8]

def binarySearch(aList, t):

low = 0

heigh = len(aList) - 1

while low <= heigh: # 这里为了防止，low=height然后不进入程序，return正确的情况，如：t=3,low=heigh=2

mid = (low + heigh) / 2

print ‘mid:‘,mid

if t > aList[mid]:

low = mid + 1

elif t < aList[mid]:

heigh = mid - 1

else:

print "索引,值:",mid,aList[mid]

return mid # 返回索引值

print ‘low:‘,low

print ‘heigh:‘,heigh

return -1 # 为了防止元素找不到的情况，就返回-1

print binarySearch(aList,2)

三、排序算法

3.1 冒泡排序

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = ‘WangQiaomei‘

import random
import time

‘‘‘
aList=[]
for i in range(20):
aList.append(random.randrange(100))
print aList
‘‘‘
aList=[]
for i in range(50000):
aList.append(random.randrange(100000))

def bubble_sort(aList):# 例如 aList的个数是10个
    for i in range(len(aList)): # 循环索引 0-9
        for j in range(len(aList)-i-1):    # 第一次循环索引j为：8,这里为啥要-1，因为下面会有j+1
            if aList[j]>aList[j+1]:
                temp=aList[j+1]
                aList[j+1]=aList[j]
                aList[j] = temp
    return aList

start_time=time.time()
print bubble_sort(aList)[0:20]
end_time=time.time()
print end_time-start_time

# 给5万个数排序，282秒

3.2 选择排序

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = ‘WangQiaomei‘

import random
import time

‘‘‘
aList=[]
for i in range(20):
aList.append(random.randrange(100))
print aList
‘‘‘
aList=[]
for i in range(50000):
aList.append(random.randrange(100000))

#print aList

def select_sort(aList):
    for i in range(len(aList)):
        for j in range(i,len(aList)):
            if aList[i]>aList[j]:
                temp = aList[i]
                aList[i]= aList[j]
                aList[j]= temp
    return aList

start_time=time.time()
print select_sort(aList)[0:20]
end_time=time.time()
print end_time-start_time

‘‘‘
第一层循环是循环整个列表
第二层是从i开始循环，到列表结尾。
如果找到比aList[i]小的元素，就和aList[i]交换。
和冒泡算法的时间和空间复杂度基本是一样的。区别是：
1）冒泡算法是两两交换，循环交换的结果把最大的数依次放在最后面。
2）选择排序是把当前的数和aList[i],循环结果就是把最小的数依次放在前面。
# 给5万个数排序，225秒
‘‘‘

3.3 直接插入排序

插入排序(Insertion Sort)的基本思想是：将列表分为2部分，左边为排序好的部分，右边为未排序的部分，循环整个列表，每次将一个待排序的记录，按其关键字大小插入到前面已经排好序的子序列中的适当位置，直到全部记录插入完成为止。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = ‘WangQiaomei‘

import random
import time

‘‘‘
aList=[]
for i in range(20):
aList.append(random.randrange(100))
print aList
‘‘‘
‘‘‘
插入排序，是已经有一个已排序列表，索引是：0到i-1,靠向右移动一个位置，腾出一个空位来插入当前值。
详细：
由于插入排序是：通过从索引“0到i-1”已经排好序的列表中，由iCur（aList[i]）去从跟从i-1，一直旺座不停的比对，一直到<某个元素,
就插入到某个元素的前面。其实就是顺序查找插入，时间复杂度;O(n)。
注意：这里不可能改变列表的个数，当然更不能用insert语句了。
那怎么保持原列表不变，从已经排好序的列表里（0到i-1）,插入一个数呢？
就通过：
如果iCur的左边的紧靠的元素比它大,要把左边的元素一个一个的往右移一位,
直到iCur比aList[position-1]小,iCur插入到左边挪一个位置出来
也就是靠向右移动位置，给icur腾出一个空位，以便插入！
‘‘‘

aList=[]
for i in range(50000):
aList.append(random.randrange(100000))

def insert_sort(aList):
    for i in range(1,len(aList)):   # 默认列表第一个已经排好序了
        iCur= aList[i]
        position=i
        while position>0 and iCur<aList[position-1]:
            aList[position]=aList[position-1]
            position-=1
        aList[position]=iCur
    return aList

start_time=time.time()
print insert_sort(aList)[0:20]
end_time=time.time()
print end_time-start_time

‘‘‘
# 给5万个数排序，149秒
‘‘‘

四、快速排序

设要排序的数组是A[0]……A[N-1]，首先任意选取一个数据（通常选用数组的第一个数）作为关键数据，然后将所有比它小的数都放到它前面，所有比它大的数都放到它后面，这个过程称为一趟快速排序。值得注意的是，快速排序不是一种稳定的排序算法，也就是说，多个相同的值的相对位置也许会在算法结束时产生变动　　

注：在待排序的文件中，若存在多个关键字相同的记录，经过排序后这些具有相同关键字的记录之间的相对次序保持不变，该排序方法是稳定的；若具有相同关键字的记录之间的相对次序发生改变，则称这种排序方法是不稳定的。

要注意的是，排序算法的稳定性是针对所有输入实例而言的。即在所有可能的输入实例中，只要有一个实例使得算法不满足稳定性要求，则该排序算法就是不稳定的。

4.1 快速排序--清爽代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = ‘WangQiaomei‘

def quick_sort(aList, left, right):
    if left >= right:
        return
    low = left
    high = right
    k = aList[left]
    while low < high:
        while high > 0 and low != high and aList[low] <= aList[high]:
            high -= 1
        temp = aList[low]
        aList[low] = aList[high]
        aList[high] = temp

while low != high and aList[high] > aList[low]:
            low += 1
        temp = aList[high]
        aList[high] = aList[low]
        aList[low] = temp
    quick_sort(aList, left, low - 1)
    quick_sort(aList, low + 1, right)

aList = [83, 83, 94, 51, 9, 79, 40, 68, 12, 17]

print aList
quick_sort(aList, 0, len(aList) - 1)
print aList

‘‘‘
打印结果：
[83, 83, 94, 51, 9, 79, 40, 68, 12, 17]
[9, 12, 17, 40, 51, 68, 79, 83, 83, 94]
‘‘‘

4.2 快速排序-错误示范讲解

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = ‘WangQiaomei‘
import random
‘‘‘
aList=[6,2,5,11,3,8,9]
6,2,5,11,3,8,9  current_val=6 索引：low=0,high=6 初始值
此时算hight的：从后往前，跟6比大小，high的索引递减，这里递减了2次，注意：直到遇见比6小的，才交换位置。
3,2,5,11,6,8,9  current_val=6 索引：low=0,high=4
此时算low的：从前往后，跟6比大小，low的索引递增，这里递增了3次，注意：直到遇见比6大的，才交换位置。
3,2,5,6,11,8,9  current_val=6 索引：low=3,high=4
此时算hight的：从后往前，因为11比6大，high的索引-1=3,不交换位置。此时：low=high=6，
这是第一次排序，把比6小的发在6的左边，把比6大的放在6的右边。
3,2,5,6,11,8,9  current_val=6 索引：low=3,high=3

开始第二次排序，先排序6的左边：此时6的位置已经固定，不需要排它了！
注意：此时low和high的索引还是针对完整列表（第一次排序好的列表：
[3,2,5,6,11,8,9]）来说的。因为是给aList排序，不是给[3,2,5]排序！
3,2,5           current_val=3 索引：low=0,high=2  初始值
2,3,5           current_val=3 索引：low=0,high=1  从后向前，交换
2,3,5           current_val=3 索引：low=1,high=1  不交换

开始第三次排序，排6的右边：此时6的位置已经固定，不需要排它了！
注意：此时low和high的索引还是针对第二次排序好的列表：
[2,3,5,6,11,8,9]）来说的。
11,8,9          current_val=11 索引：low=4,high=6 初始值
9,8,11          current_val=11 索引：low=4,high=5 从后向前，交换
8,9,11          current_val=11 索引：low=5,high=5 从前向后，交换

第三次排序好的列表，就是最终结果，因为左边列表和右边的列表，都分别得到了一个值。
最终结果：
[2,3,5,6,8,9,11]
‘‘‘

def quick_sort(aList, left,right):  # left 和right是为了递归用的。
    # if low==high and low>0:
    if left>=right:
        return
    low=left            # 这两句是为了递归用的
    high= right
    k = aList[left]     # 定的固定值，以它为标杆排序
    while low<high:
        # print ‘aList[low]:‘,aList[low]
        # print ‘aList[high]:‘,aList[high]
        # print ‘low:‘,low
        # print ‘high:‘,high
        print aList

# while high>0 and low!=high and aList[low]<=aList[high]: # 此时 aList[low]是关键字，递归low的值。这是对的
        ‘‘‘
        注意:这里high是递减的，可能high会减成负数，会报错，所以high>0
        high是递减的，如果high减的跟low相等了，不应该再执行，结果再执行high-=1,则high<low，结果错误的交换了！

如下所示：
        [9, 12, 51, 17, 40, 68, 79, 83, 94, 83]
        low1: 5
        high1: 5
        low2: 5
        high2: 4
        [9, 12, 51, 17, 68, 40, 79, 83, 94, 83]

所以，这里应该写成：
        while high>0 and low!=high and aList[low]<=aList[high]:
        或者直接写成：
        while low<high and aList[low]<=aList[high]:
        ‘‘‘
        # 有时候有多个相同的元素，所以要写成<=
        while high>0 and aList[low]<=aList[high]: # 此时 aList[low]是关键字，递归low的值。应该加上条件：and low!=high

# while high>0 and k<=aList[high]:    # 这样写也是对的,关键字就是k。这时候k就是aList[low]
            if low==high:
                print ‘low1:‘,low
                print ‘high1:‘,high
            high-=1
        print ‘low2:‘,low
        print ‘high2:‘,high
        temp=aList[low]         # 其实是low和high之间互换位置。
        aList[low]= aList[high]
        aList[high]=temp
        print aList
        #print ‘sec_aList[low]:‘,aList[low]
        #print ‘sec_aList[high]:‘,aList[high]
        # 因为low和high是互相变动的，有的时候low是关键字，有的时候high是关键字，有的时候low=high=关键字
        # 而每次while循环，都只针对一个固定值，小的放左边，大的放右边

‘‘‘
        这里也一样，如果low+=1的话，low和high相等的时候（本来不应该执行了），low再加1，则又做了错误的交换了。
        ‘‘‘
        # while low!=high and aList[high]>aList[low]:   # 此时 aList[high]是关键字，递归low的值是对的
        while aList[high]>aList[low]:   # 此时 aList[high]是关键字，递归low的值，应该加上条件：andand low!=high
        # while k>aList[low]: # 这样写也是对的，关键字就是k。这时候k就是aList[high]
            if low==high:
                print ‘low3:‘,low
                print ‘high3:‘,high
            low+=1
        temp=aList[high]
        aList[high]= aList[low]
        aList[low]=temp

#print ‘result:‘,aList
    # if low==high and low>0:
    # quick_sort(aList, 0,low-1)
    #print ‘left:‘,left
    #print ‘low-1:‘,low-1
    # quick_sort(aList, 0,low-1)
    quick_sort(aList, left,low-1)
    # quick_sort(aList, low+1,len(aList)-1)
    quick_sort(aList, low+1,right)

#print aList

‘‘‘
aList=[]
for i in range(20):
aList.append(random.randrange(100))
print aList

aList=[6,2,5,11,3,8,9]

aList=[]
for i in range(10):
aList.append(random.randrange(100))
‘‘‘

aList=[83, 83, 94, 51, 9, 79, 40, 68, 12, 17]
# aList=[83, 83, 94, 51, 9, 79, 40]
print aList
quick_sort(aList, 0,len(aList)-1)
print aList

4.3 快速排序--正确

第三次排序好的列表，就是最终结果，因为左边列表和右边的列表，都分别得到了一个值。
最终结果：
[2,3,5,6,8,9,11]
‘‘‘

# while high>0 low!=high and aList[low]<=aList[high]: # 此时 aList[low]是关键字，递归low的值。这是对的
        ‘‘‘
        注意:这里high是递减的，可能high会减成负数，会报错，所以high>0
        high是递减的，如果high减的跟low相等了，不应该再执行，结果再执行high-=1,则high<low，结果错误的交换了！

如下所示：
        [9, 12, 51, 17, 40, 68, 79, 83, 94, 83]
        low1: 5
        high1: 5
        low2: 5
        high2: 4
        [9, 12, 51, 17, 68, 40, 79, 83, 94, 83]

所以，这里应该写成：
        while high>0 and low!=high and aList[low]<=aList[high]:
        或者直接写成：
        while low<high and aList[low]<=aList[high]:
        ‘‘‘
        # 有时候有多个相同的元素，所以要写成<=
        while high>0 and low!=high and aList[low]<=aList[high]:
        # while high>0 and aList[low]<=aList[high]: # 此时 aList[low]是关键字，递归low的值。应该加上条件：and low!=high

# while high>0 and k<=aList[high]:    # 这样写也是对的,关键字就是k。这时候k就是aList[low]
            ‘‘‘
            if low==high:
                print ‘low1:‘,low
                print ‘high1:‘,high
            ‘‘‘
            high-=1
        print ‘low2:‘,low
        print ‘high2:‘,high
        temp=aList[low]         # 其实是low和high之间互换位置。
        aList[low]= aList[high]
        aList[high]=temp
        print aList
        #print ‘sec_aList[low]:‘,aList[low]
        #print ‘sec_aList[high]:‘,aList[high]
        # 因为low和high是互相变动的，有的时候low是关键字，有的时候high是关键字，有的时候low=high=关键字
        # 而每次while循环，都只针对一个固定值，小的放左边，大的放右边

‘‘‘
        这里也一样，如果low+=1的话，low和high相等的时候（本来不应该执行了），low再加1，则又做了错误的交换了。
        ‘‘‘
        while low!=high and aList[high]>aList[low]:   # 此时 aList[high]是关键字，递归low的值是对的

#while aList[high]>aList[low]:   # 此时 aList[high]是关键字，递归low的值，应该加上条件：andand low!=high
        # while k>aList[low]: # 这样写也是对的，关键字就是k。这时候k就是aList[high]
            ‘‘‘
            if low==high:
                print ‘low3:‘,low
                print ‘high3:‘,high
            ‘‘‘
            low+=1
        temp=aList[high]
        aList[high]= aList[low]
        aList[low]=temp

#print aList

‘‘‘
aList=[]
for i in range(20):
aList.append(random.randrange(100))
print aList

aList=[6,2,5,11,3,8,9]

aList=[]
for i in range(10):
aList.append(random.randrange(100))
‘‘‘

aList=[83, 83, 94, 51, 9, 79, 40, 68, 12, 17]
# aList=[83, 83, 94, 51, 9, 79, 40]
print aList
quick_sort(aList, 0,len(aList)-1)
print aList

时间： 2024-10-08 18:41:45

s11d27 算法

s11d27 算法

一、理论

1.1 时间复杂度和空间复杂度的理论:

1.2 函数调用的时间复杂度分析

二、查找算法

2.1 两分法

三、排序算法

3.1 冒泡排序

3.2 选择排序

3.3 直接插入排序

四、快速排序

4.1 快速排序--清爽代码

4.2 快速排序-错误示范讲解

4.3 快速排序--正确

s11d27 算法的相关文章

经典排序算法 - 冒泡排序Bubble sort

转载：DenseNet算法详解

基于位置信息的聚类算法介绍及模型选择

密码算法详解——AES

矩阵乘法的Strassen算法详解

关于SVM数学细节逻辑的个人理解（三）：SMO算法理解

基于Spark MLlib平台的协同过滤算法---电影推荐系统

算法希尔排序

算法排序NB二人组堆排序归并排序