377 阿裏雲技術社區[雲棲]

ODPS JOB 長尾問題調優

引言

上篇JOB logview 查看問題

提到長尾問題，本文深入探討下長尾調優的方法

概述

因為數據分布不均，導致各個節點的工作量不同，整個任務就需要等最慢的節點完成才能完成。這種問題就是長尾問題，是分布式計算裏最常見的問題之一，也是典型的疑難雜症。

處理這類問題的思路就是把工作分給多個Worker去執行，而不是一個Worker單獨抗下最重的那份工作。本文分享平時工作中遇到的一些典型的長尾問題的場景及其解決方案。

解決長尾問題的方法

通過Combiner解決長尾

對於MapRedcuce作業，使用Combiner是一種常見的長尾優化策略。在WordCount的例子裏，就已經有提到這種做法。通過Combiner，減少Maper Shuffle往Reducer的數據，可以大大減少網絡傳輸的開銷。對於MaxCompute SQL，這種優化會由係統自動完成。

需要注意的是，Combiner隻是Map端的優化，需要保證是否執行Combiner的結果是一樣的。以WordCount為例，傳2個(KEY,1)和傳1個(KEY,2)的結果是一樣的。但是比如在做平均值的時候，就不能在Combiner裏就把(KEY,1)和(KEY,2)合並成(KEY,1.5)。

通過係統優化解決長尾

針對長尾這種場景，除了前麵提到的Local Combiner，MaxCompute係統本身還做了一些優化。比如在跑任務的時候，日誌裏突然打出這樣的內容(+N backups部分)：

M1_Stg1_job0:0/521/521[100%] M2_Stg1_job0:0/1/1[100%] J9_1_2_Stg5_job0:0/523/523[100%] J3_1_2_Stg1_job0:0/523/523[100%]R6_3_9_Stg2_job0:1/1046/1047[100%]
M1_Stg1_job0:0/521/521[100%] M2_Stg1_job0:0/1/1[100%] J9_1_2_Stg5_job0:0/523/523[100%] J3_1_2_Stg1_job0:0/523/523[100%]R6_3_9_Stg2_job0:1/1046/1047[100%]
M1_Stg1_job0:0/521/521[100%] M2_Stg1_job0:0/1/1[100%] J9_1_2_Stg5_job0:0/523/523[100%] J3_1_2_Stg1_job0:0/523/523[100%] R6_3_9_Stg2_job0:1/1046/1047(+1backups)[100%]
M1_Stg1_job0:0/521/521[100%] M2_Stg1_job0:0/1/1[100%] J9_1_2_Stg5_job0:0/523/523[100%] J3_1_2_Stg1_job0:0/523/523[100%] R6_3_9_Stg2_job0:1/1046/1047(+1backups)[100%]

可以看到1047個Reducer，有1046個已經完成了，但是最後一個一直沒完成。係統識別出這種情況後，自動啟動了一個新的Reducer，跑一樣的數據，然後看兩個哪個快，取快的數據歸並到最後的結果集裏。

通過業務優化解決長尾

雖然前麵的優化策略有很多，但是實際上還是有限。有時候碰到長尾問題，還需要從業務角度上想想是否有更好的解決方法，比如：

實際數據可能包含非常多的噪音。如，需要根據訪問者的ID進行計算，看每個用戶的訪問記錄的行為。需要先去掉爬蟲的數據（現在的爬蟲已越來越難識別），否則爬蟲數據很容易長尾計算的長尾。類似的情況還有根據xxid進行關聯的時候，需要考慮這個關聯字段是否存在為空的情況。
一些業務特殊情況，如，ISV的操作記錄，在數據量、行為方式上都會和普通的個人會有很大的區別。那麼可以考慮針對大客戶，使用特殊的分析方式進行單獨處理。
數據分布不均勻的情況下，不要使用常量字段做Distribute by字段來實現全排序。

最後更新：2017-04-01 17:00:39

ODPS JOB 長尾問題調優

引言

概述

分類

Join長尾

MAPJOIN HINT

Group By長尾

Distinct長尾

動態分區長尾

解決長尾問題的方法

通過Combiner解決長尾

通過係統優化解決長尾

通過業務優化解決長尾

上一篇：想要一步登天，隻會墜落深淵--奇葩冒牌程序員的故事

下一篇：阿裏巴巴 Java 開發手冊之編程規約（二）-------我的經驗(逐步完善中)

相關內容

熱門內容

最新內容

ODPS JOB 長尾問題調優

引言

概述

分類

Join長尾

MAPJOIN HINT

Group By長尾

Distinct長尾

動態分區長尾

解決長尾問題的方法

通過Combiner解決長尾

通過係統優化解決長尾

通過業務優化解決長尾

上一篇： 想要一步登天，隻會墜落深淵--奇葩冒牌程序員的故事

下一篇： 阿裏巴巴 Java 開發手冊之編程規約（二）-------我的經驗(逐步完善中)

相關內容

熱門內容

最新內容

上一篇：想要一步登天，隻會墜落深淵--奇葩冒牌程序員的故事

下一篇：阿裏巴巴 Java 開發手冊之編程規約（二）-------我的經驗(逐步完善中)