928 技術社區[雲棲]

編程之美之2.5 尋找最大的K個數

【題目】

有很多無序的數，從中找出最大的K個數。假定他們都不相等。

【解法一】

如果數據不是很多，例如在幾千個左右，我們可以排一下序，從中找出最大的K個數。排序可以選擇快速排序或者堆排序

[cpp] view plain copy

#include<stdio.h>
#include<stdlib.h>
int cmp(const void *a,const void *b){
return *(int *)a - *(int *)b;
}
int main(){
int n,k;
int Num[1000];
while(scanf("%d %d",&n,&k) != EOF){
//輸入數據
for(int i = 0;i < n;i++){
scanf("%d",&Num[i]);
}
//排序
qsort(Num,n,sizeof(Num[0]),cmp);
//選出最大的K個數
for(i = n-k;i < n;i++){
printf("%d ",Num[i]);
}
printf("\n");
}
return 0;
}

【解法二】

我們可以繼續對上麵的算法進行優化，我們隻是從這些無序的數中選出最大的K個數，並不需要前K個數據有序，也不需要後N-K個數據有序。

怎樣才能避免做後N-K個數據有序呢？

回憶一下快速排序，快排中的每一步，都是將待排數據分做兩組，其中一組的數據的任何一個數都比另一組中的任何一個大，然後再對兩組分別做類似的操
作，然後繼續下去……在本問題中，假設 N 個數存儲在數組 S 中，我們從數組 S 中隨機找出一個元素 X，把數組分為兩部分 Sa 和 Sb。

Sa 中的元素大於等於 X，Sb 中元素小於 X。這時，有兩種可能性：
1. Sa中元素的個數小於K，Sa中所有的數和Sb中最大的K-|Sa|個元素（|Sa|指Sa中元素的個數）就是數組S中最大的K個數。
2. Sa中元素的個數大於或等於K，則需要返回Sa中最大的K個元素。

這樣遞歸下去，不斷把問題分解成更小的問題，平均時間複雜度 O（N *log2K）。

[cpp] view plain copy

#include<stdio.h>
#include<stdlib.h>
//進行一次快速排序用哨兵數分割數組中的數據
int Partition(int a[],int low,int high){
int i,j,index;
i = low;
j = high;
//哨兵
index = a[i];
while(i < j){
//從右向左找大於index的數來填a[i]
while(a[j] < index && i < j){
j--;
}
//把找到大於index的數賦值給a[i]
if(i < j){
a[i] = a[j];
i++;
}
//從左向右找小於index的數來填a[j]
while(a[i] >= index && i < j){
i++;
}
//把找到小於index的數賦值給a[j]
if(i < j){
a[j] = a[i];
j--;
}
}
a[i] = index;
return i;
}
int KBig(int a[],int low,int high,int k){
int index,n;
if(low < high){
//對數組進行劃分，返回劃分的位置
index = Partition(a,low,high);
n = index - low + 1;
//如果等於K返回第K個下標
if(n == k){
return index;
}
//不夠K個再找k-n個
else if(n < k){
return KBig(a,index+1,high,k-n);
}
//如果大於K個則從些中選出最大的K個
else{
return KBig(a,low,index,k);
}
}
}
int main(){
int a[] = {4,5,1,6,2,7,3,8};
for(i = 0;i <= KBig(a,0,7,6);i++){
printf("%d ",a[i]);
}
printf("\n");
return 0;
}

【解法三】

用容量為K的最小堆來存儲最大的K個數。最小堆的堆頂元素就是最大K個數中的最小的一個。每次掃描一個數據X，如果X比堆頂元素Y小，則不需要改變原來的堆，因為這個元素比最大的K個數要小。如果X比堆頂元素大，那麼用X替換堆頂元素Y，在替換之後，X可能破壞了最小堆的結構，需要調整堆來維持堆的性質。調整過程時間複雜度為O(logK)。

當數據量很大時（100億？這時候數據已經不能全部裝入內存，所以要求盡可能少的遍曆數組）可以采用這種方法。

[cpp] view plain copy

#include<stdio.h>
#include<stdlib.h>
//調整以index為根的子樹
//k：堆中元素個數
int MinHeap(int a[],int index,int k){
int MinIndex = index;
//左子節點
int LeftIndex = 2*index;
//右子節點
int RightIndex = 2*index+1;
if(LeftIndex <= k && a[LeftIndex] < a[MinIndex]){
MinIndex = LeftIndex;
}
if(RightIndex <= k && a[RightIndex] < a[MinIndex]){
MinIndex = RightIndex;
}
//如果a[index]是最小的，則以index為根的子樹已是最小堆否則index的子節點有最小元素
//則交換a[index],a[MinIndex],從而使index及子女滿足堆性質
int temp;
if(MinIndex != index){
//交換a[index],a[MinIndex]
temp = a[index];
a[index] = a[MinIndex];
a[MinIndex] = temp;
//重新調整以MinIndex為根的子樹
MinHeap(a,MinIndex,k);
}
return 0;
}
//建堆：將一個數組a[1-k]變成一個最小堆
int BuildMinHeap(int a[],int k){
int i;
//用容量為k的最小堆來存儲最大的k個數
for(i = k;i >= 1;i--){
//調整以i為根節點的樹使之成為最小堆
MinHeap(a,i,k);
}
return 0;
}
int main(){
int n = 6;
int k = 3;
//a[0]不用，堆的根結點是從1開始的
int a[] = {0,3,17,8,27,7,20};
//BulidMaxHeap將輸入數組構造一個最小堆
BuildMinHeap(a,k);
//數組中最小元素在根a[1]
for(int i = n;i > k;i--){
//如果X比堆頂元素Y小，則不需要改變原來的堆
//如果X比堆頂元素Y大，那麼用X替換堆頂元素Y，在替換之後，X可能破壞了最小堆的結構，需要調整堆來維持堆的性質
int temp;
if(a[1] < a[i]){
//交換
temp = a[i];
a[i] = a[1];
a[1] = temp;
//重新調整，保持最小堆的性質
MinHeap(a,1,k);
}
}
for(i = 1;i <= k;i++){
printf("%d ",a[i]);
}
return 0;
}

如果不明白堆的用法，可以參考：堆排序

堆排序中主要講解最大堆，最大堆和最小堆幾乎一樣。自己看看就知道了。

【解法四】

這個方法受到一定的限製。

如果所有N個數都是正整數，而且取值範圍都不太大。可以考慮申請空間，記錄每個整數出現的次數，然後再從大到小取最大的K個。

[cpp] view plain copy

#include<stdio.h>
#include<string.h>
const int MaxN = 100;
int count[MaxN];
int main(){
int k = 3;
int a[] = {3,17,8,27,7,20};
memset(count,0,MaxN);
//統計每個數重複次數
for(int i = 0;i < 6;i++){
count[a[i]]++;
}
//選取最大K個數
int sumCount = 0;
for(i = MaxN;i >= 0;i--){
sumCount += count[i];
if(sumCount >= k){
break;
}
}
//輸出
int index = i;
for(i = index;i < MaxN;i++){
if(count[i] > 0){
printf("%d ",i);
}
}
printf("\n");
return 0;
}

最後更新：2017-04-03 08:26:12

編程之美之2.5 尋找最大的K個數

【題目】

【解法一】

【解法二】

【解法三】

【解法四】

上一篇： ObjectArx學習筆記-畫線

下一篇：教你解決Sublime Text中文亂碼問題

相關內容

熱門內容

最新內容

編程之美之2.5 尋找最大的K個數

【題目】

【解法一】

【解法二】

【解法三】

【解法四】

上一篇： ObjectArx學習筆記-畫線

下一篇： 教你解決Sublime Text中文亂碼問題

相關內容

熱門內容

最新內容

下一篇：教你解決Sublime Text中文亂碼問題