690 阿里云技术社区[云栖]

排序算法总结-python实现

最近在复习软考，把看到的排序算法整理了一下，之所以用python写，是因为python写起来简单....好吧，后来写的时候发现有些地方用C写还方便些。python虽然简洁，但用起来效率感觉还是有些低，不过这不是重点啦。。。

1.代码与说明

# -*- coding: utf-8 -*-

def bubbleSort(Data):
    '''冒泡排序： 时间复杂度最好O(n)，平均O(n*n)，最坏O(n*n)，辅助空间 O(1)，算法稳定
       n个数，每次从第一个数开始和相邻的数比较，将大的冒泡到后面去。第一趟将最大的冒泡到最后，
       然后第二次只需比较0~n-1，将其中最大的冒泡到n-1，依次下去...总共进行n-1趟排序即可
    '''
    if Data:
        for i in range(len(Data)):
            for j in range(len(Data)-i-1):
                if Data[j]>Data[j+1]:
                    Data[j],Data[j+1]=Data[j+1],Data[j]
    return Data

def quickSort(Data,low,high):
    '''快速排序：O(n*logn),O(n*logn),O(n*n),O(n*logn),不稳定
        冒泡的改进，被认为是当前最优秀的内部排序算法（当然这也不是绝对的，还要看具体情况）。实现基于分治法：分解-解决-合并。
        基本思想：
        1.从数列中取出一个基数，
        2.将数列中比他大的放在右边，小的在左边。
        3.两边区间重复2，直到各区间只有一个数。
        整个算法中的基数就是个坑，跳来跳去，总之比他小始终放一边，大的放另一边就行
        参考：https://blog.csdn.net/morewindows/article/details/6684558
    '''
    if low < high:
        left,right,base=low,high,Data[low]
        while left <right:
            #从后往前找比base小的数
            while left <right and Data[right] >=base:
                right-=1
            if left < right:
                Data[left]=Data[right]
                #left+=1 这里直接+1更快，因为Data[left]必然小于base，下次循环不用算
            #从前往后找比base大的数
            while left <right and Data[left] < base:
                left+=1
            if left <right:
                Data[right]=Data[left]
                #right-=1
        #left=right时一趟循环终止，base填回坑里去
        Data[left]=base             
        quickSort(Data,low,left-1)  #递归左边
        quickSort(Data,left+1,high) #递归右边
        
def insertSort(Data):
    '''插入排序： 时间复杂度最好O(n)，平均O(n*n)，最坏O(n*n)，辅助空间 O(1)，算法稳定
        如果Data不为空则开始比较。Data[0]~Data[j]是排好的序列L1，key是未排待插入数据
        如果key小于L1的最大值则将进行插入操作，while循环找到比key小的index并将key插入
        在index后面。while循环用来寻找插入位置并将比key大的数后移，如果key本身比L1的
        最大值还大则无需插入，直接for循环比较下一个
    '''
    if Data:
        for i in range(1,len(Data)):
            key,j = Data[i],i-1
            while j>=0 and Data[j] > key:
                Data[j+1]=Data[j]
                j-=1
            Data[j+1]=key
    return Data

def selectSort(Data):
    '''选择排序： 时间复杂度最好O(n*n)，平均O(n*n)，最坏O(n*n)，辅助空间 O(1)，算法不稳定
        n个数，每一趟从待排序列L2中选择最大（或最小）数顺序放在已排好序列L1后面（或前面）
        总共经过n-1趟可排好，与插入排序相比，都是将数据分为已排和未排序列并将未排元素整理
        到已排序列中，不同的是插入排序在未排序列中按序整理，选排则是按大小选择整理。
    '''
    if Data:
        for i in range(len(Data)-1):
            minnum=i
            for j in range(i+1,len(Data)):#在L2中寻找最小值
                if Data[j]<Data[minnum]:
                    minnum=j
            if minnum != i:#如果找到直接交换，插入在L1后面
                Data[i],Data[minnum]=Data[minnum],Data[i]
    return Data
                    
def shellSort(Data):
    '''希尔排序: 时间复杂度最好未知，平均O(pow(n,1.25)，最坏未知，辅助空间 O(1)，不稳定
        插入排序的改进，将数据分组，每组m个（m叫步长）每次对每组的第i个元素排序，
        然后再分组，再排序，直到步长为1.至于分组的方法需要理论推导，此处每次步长都取n/2减半
        更好的步长选择方法见wiki:https://zh.wikipedia.org/wiki/希尔排序
        其他实现方法：https://blog.csdn.net/morewindows/article/details/6668714
    '''
    n=len(Data)
    if  n > 1:
        gap=n/2 
        while gap > 0:   
            for i in range(gap):#按步长插入排序
                for j in range(i+gap,n,gap):
                    if Data[j] < Data[j-gap]:
                        key = Data[j]
                        k=j-gap
                        while k >=0 and Data[k] > key:
                            Data[k+gap]=Data[k]
                            k-=gap
                        Data[k+gap]=key
            gap/=2
    return Data
                    
        
if __name__ =="__main__":
    Data=[3,5,1,56,3,7,34,21,8]
    print Data
    #insertSort(Data)
    #bubbleSort(Data)
    #selectSort(Data)
    #shellSort(Data)
    quickSort(Data,0,len(Data)-1)
    print Data

2.python内置排序

实际上python列表内置了排序算法。sort和sorted。

3.瞎扯

1.内部排序是指待排序列完全存放在内存中进行的排序，适合不太大的序列。包括

插入排序（直接插入排序）

快速排序

选择排序（简单选择排序）

冒泡排序

希尔排序

堆排序

归并排序

2.外部排序指能处理大量数据的排序算法，数据不能一次装入内存，通常要借助外存储器。常采用排序-归并策略，比如外归并排序。详情参考wiki：https://zh.wikipedia.org/wiki/外排序

3.python中没有自增和自减运算，这在写代码的时候异常不方便。当然咯，这也与python的设计目标有关系。python的设计哲学是优雅，明确、简单。他们可能认为这样不太优雅，不利于代码的可读性，譬如js也不推荐使用++和--。另外一个原因，那就是python不提供像C那样直接操作内存的功能。当执行a+=1时，C会直接修改a在内存中的值，而python则会在内存中新建一个整型变量（也不完全这样，有些小数据python会复用，见下面第4点），然后让a指向它。所以如果要执行a++，C语言中a还是那个a，而python中的a已经不是原来的a了，这样就乱套了！

说到这里，再扯一下python中的可变对象和不可变对象。python中所有对象都是值的引用。不可变指的是值不可变。要修改变量的值就要在内存中新建一个值并让变量指向它，原来的如果不用就会被GC回收。可变对象不需要在其他地方申请内存，直接在自己后面申请/释放空间即可，原地址不变。

4.对于小数值整型对象，比如1~100，python虚拟机在启动时会先在内存中生成好，放在缓冲区以便于快速调用。看下面的例子：

开始a，b为100，a is b是True，说明a，b指向内存中同一个对象，后面值变大了，a=100000时python会在内存中新建一个对象，b=100000也会新建一个对象，所以a，b指向不同对象，故为False。id(a)是查看a的地址。

5.有关for循环，实质上是一个遍历，for i in range(0,10),range（）会生成一个0到9的list让i遍历。这样就有一个缺陷：i在循环前每一步的值是确定的，不能动态改变。而在C语言中，for(int i=n/2,i>0,i=i/2)，i是随着循环每次都会改变的。不过事实上，i的值在循环前也是可以推算出来的，因此肯定是可以用python的for循环代替C的for（int i=n/2,i>0,i=i/2),只不过LZ还没想到，谁知道还麻烦说一声，哈哈！

最后更新：2017-04-03 12:55:13

排序算法总结-python实现

1.代码与说明

2.python内置排序

3.瞎扯

上一篇： hadoop1.1.2+hbase0.92.2+nutch2.2.1+solr4.6.1配置全记录

下一篇： Linux使用rsync客户端与服务端同步目录进行备份

相关内容

热门内容

最新内容