閱讀137 返回首頁    go 技術社區[雲棲]


教你如何在機器學習競賽中更勝一籌(下)

更多深度文章,請關注:https://yq.aliyun.com/cloud


Team Machine Learning


上一節講述了機器學習的一些知識點和工具,接下來的問題會更加現實。

問答

20.

python / R

  • 如何將業務問題轉化為建模的問題
  • 如何監控模型的部署
  • 如何解釋(多次)困難的概念給利益相關者。

kagglers

21.

  • /
  • -
  • 掌握工具知識
  • 熟悉度量和優化
  • 交叉驗證
  • 模型校正
  • 集成

22.

ml

23.

github腳本比賽的機器學習方法。同時,核對這個集成指南

24.

Keras

25.

——可解釋或快速(或記憶效率)更重要。但隨著時間的推移,這將很可能改變,因為人們將不再害怕黑盒子解決方案,並專注於準確性。

26.

——有時很難跟蹤它。 這就是為什麼你應該專注於任何算法的正確使用,而不是投資於一個。

27.

Smote

28.

“數據科學玩家”的任何人都需要接受教育,接受黑箱解決方案是完全正常的。 這可能需要一段時間,所以運行一些回歸以及你正在做的任何其他建模可能會很好,並且通常會嚐試提供說明圖和總結信息,以便為您的模型為什麼執行此操作。

29.

kaggle

30.scikit learn

“人們在說

31.

32.

vowpal wabbit

33.

  • 特征變換(例如將數字或分類變量轉換為其他類型)
  • 特征選擇
  • A
  • 處理空值
  • 處理異常值

34.

35.

https://www.kaggle.com/c/malware-classification/discussion/13863

https://blog.kaggle.com/2015/05/11/microsoft-malware-winners-interview-2nd-place-gert-marios-aka-kazanova/

https://github.com/kaz-Anova/ensemble_amazon

https://blog.kaggle.com/2015/12/03/dato-winners-interview-1st-place-mad-professors/

https://blog.kaggle.com/2016/04/08/homesite-quote-conversion-winners-write-up-1st-place-kazanova-faron-clobber/

https://mlwave.com/how-we-won-3rd-prize-in-crowdanalytix-copd-competition/

https://blog.kaggle.com/2016/08/31/avito-duplicate-ads-detection-winners-interview-2nd-place-team-the-quants-mikel-peter-marios-sonny/

https://blog.kaggle.com/2016/12/15/bosch-production-line-performance-competition-winners-interview-3rd-place-team-data-property-avengers-darragh-marios-mathias-stanislav/

36.

37.

看這裏

38.

Weka


本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。

文章原標題《Winning Tips on Machine Learning Competitions by Kazanova, Current Kaggle #3》,作者:Team Machine Learning譯者:tiamo_zn,審校:。

文章為簡譯,更為詳細的內容,請查看原文

最後更新:2017-04-16 22:02:11

  上一篇:go 1.3—Spring基礎配置—AOP
  下一篇:go 開源維護者Lawso:最讓人火大的是哪類人?