排序算法总结-python实现
最近在复习软考,把看到的排序算法整理了一下,之所以用python写,是因为python写起来简单....好吧,后来写的时候发现有些地方用C写还方便些。python虽然简洁,但用起来效率感觉还是有些低,不过这不是重点啦。。。
1.代码与说明
# -*- coding: utf-8 -*- def bubbleSort(Data): '''冒泡排序: 时间复杂度最好O(n),平均O(n*n),最坏O(n*n),辅助空间 O(1),算法稳定 n个数,每次从第一个数开始和相邻的数比较,将大的冒泡到后面去。第一趟将最大的冒泡到最后, 然后第二次只需比较0~n-1,将其中最大的冒泡到n-1,依次下去...总共进行n-1趟排序即可 ''' if Data: for i in range(len(Data)): for j in range(len(Data)-i-1): if Data[j]>Data[j+1]: Data[j],Data[j+1]=Data[j+1],Data[j] return Data def quickSort(Data,low,high): '''快速排序:O(n*logn),O(n*logn),O(n*n),O(n*logn),不稳定 冒泡的改进,被认为是当前最优秀的内部排序算法(当然这也不是绝对的,还要看具体情况)。实现基于分治法:分解-解决-合并。 基本思想: 1.从数列中取出一个基数, 2.将数列中比他大的放在右边,小的在左边。 3.两边区间重复2,直到各区间只有一个数。 整个算法中的基数就是个坑,跳来跳去,总之比他小始终放一边,大的放另一边就行 参考:https://blog.csdn.net/morewindows/article/details/6684558 ''' if low < high: left,right,base=low,high,Data[low] while left <right: #从后往前找比base小的数 while left <right and Data[right] >=base: right-=1 if left < right: Data[left]=Data[right] #left+=1 这里直接+1更快,因为Data[left]必然小于base,下次循环不用算 #从前往后找比base大的数 while left <right and Data[left] < base: left+=1 if left <right: Data[right]=Data[left] #right-=1 #left=right时一趟循环终止,base填回坑里去 Data[left]=base quickSort(Data,low,left-1) #递归左边 quickSort(Data,left+1,high) #递归右边 def insertSort(Data): '''插入排序: 时间复杂度最好O(n),平均O(n*n),最坏O(n*n),辅助空间 O(1),算法稳定 如果Data不为空则开始比较。Data[0]~Data[j]是排好的序列L1,key是未排待插入数据 如果key小于L1的最大值则将进行插入操作,while循环找到比key小的index并将key插入 在index后面。while循环用来寻找插入位置并将比key大的数后移,如果key本身比L1的 最大值还大则无需插入,直接for循环比较下一个 ''' if Data: for i in range(1,len(Data)): key,j = Data[i],i-1 while j>=0 and Data[j] > key: Data[j+1]=Data[j] j-=1 Data[j+1]=key return Data def selectSort(Data): '''选择排序: 时间复杂度最好O(n*n),平均O(n*n),最坏O(n*n),辅助空间 O(1),算法不稳定 n个数,每一趟从待排序列L2中选择最大(或最小)数顺序放在已排好序列L1后面(或前面) 总共经过n-1趟可排好,与插入排序相比,都是将数据分为已排和未排序列并将未排元素整理 到已排序列中,不同的是插入排序在未排序列中按序整理,选排则是按大小选择整理。 ''' if Data: for i in range(len(Data)-1): minnum=i for j in range(i+1,len(Data)):#在L2中寻找最小值 if Data[j]<Data[minnum]: minnum=j if minnum != i:#如果找到直接交换,插入在L1后面 Data[i],Data[minnum]=Data[minnum],Data[i] return Data def shellSort(Data): '''希尔排序: 时间复杂度最好未知,平均O(pow(n,1.25),最坏未知,辅助空间 O(1),不稳定 插入排序的改进,将数据分组,每组m个(m叫步长)每次对每组的第i个元素排序, 然后再分组,再排序,直到步长为1.至于分组的方法需要理论推导,此处每次步长都取n/2减半 更好的步长选择方法见wiki:https://zh.wikipedia.org/wiki/希尔排序 其他实现方法:https://blog.csdn.net/morewindows/article/details/6668714 ''' n=len(Data) if n > 1: gap=n/2 while gap > 0: for i in range(gap):#按步长插入排序 for j in range(i+gap,n,gap): if Data[j] < Data[j-gap]: key = Data[j] k=j-gap while k >=0 and Data[k] > key: Data[k+gap]=Data[k] k-=gap Data[k+gap]=key gap/=2 return Data if __name__ =="__main__": Data=[3,5,1,56,3,7,34,21,8] print Data #insertSort(Data) #bubbleSort(Data) #selectSort(Data) #shellSort(Data) quickSort(Data,0,len(Data)-1) print Data
2.python内置排序
3.瞎扯
1.内部排序是指待排序列完全存放在内存中进行的排序,适合不太大的序列。包括
插入排序(直接插入排序)
快速排序
选择排序(简单选择排序)
冒泡排序
希尔排序
堆排序
归并排序
2.外部排序指能处理大量数据的排序算法,数据不能一次装入内存,通常要借助外存储器。常采用排序-归并策略,比如外归并排序。详情参考wiki:https://zh.wikipedia.org/wiki/外排序
3.python中没有自增和自减运算,这在写代码的时候异常不方便。当然咯,这也与python的设计目标有关系。python的设计哲学是优雅,明确、简单。他们可能认为这样不太优雅,不利于代码的可读性,譬如js也不推荐使用++和--。另外一个原因,那就是python不提供像C那样直接操作内存的功能。当执行a+=1时,C会直接修改a在内存中的值,而python则会在内存中新建一个整型变量(也不完全这样,有些小数据python会复用,见下面第4点),然后让a指向它。所以如果要执行a++,C语言中a还是那个a,而python中的a已经不是原来的a了,这样就乱套了!
说到这里,再扯一下python中的可变对象和不可变对象。python中所有对象都是值的引用。不可变指的是值不可变。要修改变量的值就要在内存中新建一个值并让变量指向它,原来的如果不用就会被GC回收。可变对象不需要在其他地方申请内存,直接在自己后面申请/释放空间即可,原地址不变。
4.对于小数值整型对象,比如1~100,python虚拟机在启动时会先在内存中生成好,放在缓冲区以便于快速调用。看下面的例子:
开始a,b为100,a is b是True,说明a,b指向内存中同一个对象,后面值变大了,a=100000时python会在内存中新建一个对象,b=100000也会新建一个对象,所以a,b指向不同对象,故为False。id(a)是查看a的地址。
5.有关for循环,实质上是一个遍历,for i in range(0,10),range()会生成一个0到9的list让i遍历。这样就有一个缺陷:i在循环前每一步的值是确定的,不能动态改变。而在C语言中,for(int i=n/2,i>0,i=i/2),i是随着循环每次都会改变的。不过事实上,i的值在循环前也是可以推算出来的,因此肯定是可以用python的for循环代替C的for(int i=n/2,i>0,i=i/2),只不过LZ还没想到,谁知道还麻烦说一声,哈哈!
最后更新:2017-04-03 12:55:13