928
技術社區[雲棲]
編程之美之2.5 尋找最大的K個數
【題目】
有很多無序的數,從中找出最大的K個數。假定他們都不相等。
【解法一】
如果數據不是很多,例如在幾千個左右,我們可以排一下序,從中找出最大的K個數。排序可以選擇快速排序或者堆排序
- #include<stdio.h>
- #include<stdlib.h>
- int cmp(const void *a,const void *b){
- return *(int *)a - *(int *)b;
- }
- int main(){
- int n,k;
- int Num[1000];
- while(scanf("%d %d",&n,&k) != EOF){
- //輸入數據
- for(int i = 0;i < n;i++){
- scanf("%d",&Num[i]);
- }
- //排序
- qsort(Num,n,sizeof(Num[0]),cmp);
- //選出最大的K個數
- for(i = n-k;i < n;i++){
- printf("%d ",Num[i]);
- }
- printf("\n");
- }
- return 0;
- }
【解法二】
我們可以繼續對上麵的算法進行優化,我們隻是從這些無序的數中選出最大的K個數,並不需要前K個數據有序,也不需要後N-K個數據有序。
怎樣才能避免做後N-K個數據有序呢?
回憶一下快速排序,快排中的每一步,都是將待排數據分做兩組,其中一組的數據的任何一個數都比另一組中的任何一個大,然後再對兩組分別做類似的操
作,然後繼續下去……在本問題中,假設 N 個數存儲在數組 S 中,我們從數組 S 中隨機找出一個元素 X,把數組分為兩部分 Sa 和 Sb。
Sa 中的元素大於等於 X,Sb 中元素小於 X。這時,有兩種可能性:
1. Sa中元素的個數小於K,Sa中所有的數和Sb中最大的K-|Sa|個元素(|Sa|指Sa中元素的個數)就是數組S中最大的K個數。
2. Sa中元素的個數大於或等於K,則需要返回Sa中最大的K個元素。
這樣遞歸下去,不斷把問題分解成更小的問題,平均時間複雜度 O(N *log2K)。
- #include<stdio.h>
- #include<stdlib.h>
- //進行一次快速排序用哨兵數分割數組中的數據
- int Partition(int a[],int low,int high){
- int i,j,index;
- i = low;
- j = high;
- //哨兵
- index = a[i];
- while(i < j){
- //從右向左找大於index的數來填a[i]
- while(a[j] < index && i < j){
- j--;
- }
- //把找到大於index的數賦值給a[i]
- if(i < j){
- a[i] = a[j];
- i++;
- }
- //從左向右找小於index的數來填a[j]
- while(a[i] >= index && i < j){
- i++;
- }
- //把找到小於index的數賦值給a[j]
- if(i < j){
- a[j] = a[i];
- j--;
- }
- }
- a[i] = index;
- return i;
- }
- int KBig(int a[],int low,int high,int k){
- int index,n;
- if(low < high){
- //對數組進行劃分,返回劃分的位置
- index = Partition(a,low,high);
- n = index - low + 1;
- //如果等於K返回第K個下標
- if(n == k){
- return index;
- }
- //不夠K個再找k-n個
- else if(n < k){
- return KBig(a,index+1,high,k-n);
- }
- //如果大於K個則從些中選出最大的K個
- else{
- return KBig(a,low,index,k);
- }
- }
- }
- int main(){
- int a[] = {4,5,1,6,2,7,3,8};
- for(i = 0;i <= KBig(a,0,7,6);i++){
- printf("%d ",a[i]);
- }
- printf("\n");
- return 0;
- }
【解法三】
用容量為K的最小堆來存儲最大的K個數。最小堆的堆頂元素就是最大K個數中的最小的一個。每次掃描一個數據X,如果X比堆頂元素Y小,則不需要改變原來的堆,因為這個元素比最大的K個數要小。如果X比堆頂元素大,那麼用X替換堆頂元素Y,在替換之後,X可能破壞了最小堆的結構,需要調整堆來維持堆的性質。調整過程時間複雜度為O(logK)。
當數據量很大時(100億?這時候數據已經不能全部裝入內存,所以要求盡可能少的遍曆數組)可以采用這種方法。
- #include<stdio.h>
- #include<stdlib.h>
- //調整以index為根的子樹
- //k:堆中元素個數
- int MinHeap(int a[],int index,int k){
- int MinIndex = index;
- //左子節點
- int LeftIndex = 2*index;
- //右子節點
- int RightIndex = 2*index+1;
- if(LeftIndex <= k && a[LeftIndex] < a[MinIndex]){
- MinIndex = LeftIndex;
- }
- if(RightIndex <= k && a[RightIndex] < a[MinIndex]){
- MinIndex = RightIndex;
- }
- //如果a[index]是最小的,則以index為根的子樹已是最小堆否則index的子節點有最小元素
- //則交換a[index],a[MinIndex],從而使index及子女滿足堆性質
- int temp;
- if(MinIndex != index){
- //交換a[index],a[MinIndex]
- temp = a[index];
- a[index] = a[MinIndex];
- a[MinIndex] = temp;
- //重新調整以MinIndex為根的子樹
- MinHeap(a,MinIndex,k);
- }
- return 0;
- }
- //建堆:將一個數組a[1-k]變成一個最小堆
- int BuildMinHeap(int a[],int k){
- int i;
- //用容量為k的最小堆來存儲最大的k個數
- for(i = k;i >= 1;i--){
- //調整以i為根節點的樹使之成為最小堆
- MinHeap(a,i,k);
- }
- return 0;
- }
- int main(){
- int n = 6;
- int k = 3;
- //a[0]不用,堆的根結點是從1開始的
- int a[] = {0,3,17,8,27,7,20};
- //BulidMaxHeap將輸入數組構造一個最小堆
- BuildMinHeap(a,k);
- //數組中最小元素在根a[1]
- for(int i = n;i > k;i--){
- //如果X比堆頂元素Y小,則不需要改變原來的堆
- //如果X比堆頂元素Y大,那麼用X替換堆頂元素Y,在替換之後,X可能破壞了最小堆的結構,需要調整堆來維持堆的性質
- int temp;
- if(a[1] < a[i]){
- //交換
- temp = a[i];
- a[i] = a[1];
- a[1] = temp;
- //重新調整,保持最小堆的性質
- MinHeap(a,1,k);
- }
- }
- for(i = 1;i <= k;i++){
- printf("%d ",a[i]);
- }
- return 0;
- }
如果不明白堆的用法,可以參考:堆排序
堆排序中主要講解最大堆,最大堆和最小堆幾乎一樣。自己看看就知道了。
【解法四】
這個方法受到一定的限製。
如果所有N個數都是正整數,而且取值範圍都不太大。可以考慮申請空間,記錄每個整數出現的次數,然後再從大到小取最大的K個。
- #include<stdio.h>
- #include<string.h>
- const int MaxN = 100;
- int count[MaxN];
- int main(){
- int k = 3;
- int a[] = {3,17,8,27,7,20};
- memset(count,0,MaxN);
- //統計每個數重複次數
- for(int i = 0;i < 6;i++){
- count[a[i]]++;
- }
- //選取最大K個數
- int sumCount = 0;
- for(i = MaxN;i >= 0;i--){
- sumCount += count[i];
- if(sumCount >= k){
- break;
- }
- }
- //輸出
- int index = i;
- for(i = index;i < MaxN;i++){
- if(count[i] > 0){
- printf("%d ",i);
- }
- }
- printf("\n");
- return 0;
- }
最後更新:2017-04-03 08:26:12