137
技術社區[雲棲]
教你如何在機器學習競賽中更勝一籌(下)
更多深度文章,請關注:https://yq.aliyun.com/cloud
Team Machine Learning
上一節講述了機器學習的一些知識點和工具,接下來的問題會更加現實。
問答
20.
python / R
- 如何將業務問題轉化為建模的問題
- 如何監控模型的部署
- 如何解釋(多次)困難的概念給利益相關者。
kagglers
21.
- /
- -
- 掌握工具知識
- 熟悉度量和優化
- 交叉驗證
- 模型校正
- 集成
22.
ml
23.
github腳本比賽的機器學習方法。同時,核對這個集成指南。
24.
Keras
25.
——可解釋或快速(或記憶效率)更重要。但隨著時間的推移,這將很可能改變,因為人們將不再害怕黑盒子解決方案,並專注於準確性。
26.
——有時很難跟蹤它。 這就是為什麼你應該專注於任何算法的正確使用,而不是投資於一個。
27.
Smote
28.
“數據科學玩家”的任何人都需要接受教育,接受黑箱解決方案是完全正常的。 這可能需要一段時間,所以運行一些回歸以及你正在做的任何其他建模可能會很好,並且通常會嚐試提供說明圖和總結信息,以便為您的模型為什麼執行此操作。
29.
kaggle
30.scikit learn
“人們在說
31.
32.
vowpal wabbit
33.
- 特征變換(例如將數字或分類變量轉換為其他類型)
- 特征選擇
- A
- 處理空值
- 處理異常值
34.
35.
https://www.kaggle.com/c/malware-classification/discussion/13863
https://github.com/kaz-Anova/ensemble_amazon
https://blog.kaggle.com/2015/12/03/dato-winners-interview-1st-place-mad-professors/
https://mlwave.com/how-we-won-3rd-prize-in-crowdanalytix-copd-competition/
36.
37.
38.
Weka
本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。
文章原標題《Winning Tips on Machine Learning Competitions by Kazanova, Current Kaggle #3》,作者:Team Machine Learning,譯者:tiamo_zn,審校:。
文章為簡譯,更為詳細的內容,請查看原文
最後更新:2017-04-16 22:02:11