教你如何在机器学习竞赛中更胜一筹(下)
更多深度文章,请关注:https://yq.aliyun.com/cloud
Team Machine Learning
上一节讲述了机器学习的一些知识点和工具,接下来的问题会更加现实。
问答
20.
python / R
- 如何将业务问题转化为建模的问题
- 如何监控模型的部署
- 如何解释(多次)困难的概念给利益相关者。
kagglers
21.
- /
- -
- 掌握工具知识
- 熟悉度量和优化
- 交叉验证
- 模型校正
- 集成
22.
ml
23.
github脚本比赛的机器学习方法。同时,核对这个集成指南。
24.
Keras
25.
——可解释或快速(或记忆效率)更重要。但随着时间的推移,这将很可能改变,因为人们将不再害怕黑盒子解决方案,并专注于准确性。
26.
——有时很难跟踪它。 这就是为什么你应该专注于任何算法的正确使用,而不是投资于一个。
27.
Smote
28.
“数据科学玩家”的任何人都需要接受教育,接受黑箱解决方案是完全正常的。 这可能需要一段时间,所以运行一些回归以及你正在做的任何其他建模可能会很好,并且通常会尝试提供说明图和总结信息,以便为您的模型为什么执行此操作。
29.
kaggle
30.scikit learn
“人们在说
31.
32.
vowpal wabbit
33.
- 特征变换(例如将数字或分类变量转换为其他类型)
- 特征选择
- A
- 处理空值
- 处理异常值
34.
35.
https://www.kaggle.com/c/malware-classification/discussion/13863
https://github.com/kaz-Anova/ensemble_amazon
https://blog.kaggle.com/2015/12/03/dato-winners-interview-1st-place-mad-professors/
https://mlwave.com/how-we-won-3rd-prize-in-crowdanalytix-copd-competition/
36.
37.
38.
Weka
本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。
文章原标题《Winning Tips on Machine Learning Competitions by Kazanova, Current Kaggle #3》,作者:Team Machine Learning,译者:tiamo_zn,审校:。
文章为简译,更为详细的内容,请查看原文
最后更新:2017-04-16 22:02:11