阅读137 返回首页    go 阿里云 go 技术社区[云栖]


教你如何在机器学习竞赛中更胜一筹(下)

更多深度文章,请关注:https://yq.aliyun.com/cloud


Team Machine Learning


上一节讲述了机器学习的一些知识点和工具,接下来的问题会更加现实。

问答

20.

python / R

  • 如何将业务问题转化为建模的问题
  • 如何监控模型的部署
  • 如何解释(多次)困难的概念给利益相关者。

kagglers

21.

  • /
  • -
  • 掌握工具知识
  • 熟悉度量和优化
  • 交叉验证
  • 模型校正
  • 集成

22.

ml

23.

github脚本比赛的机器学习方法。同时,核对这个集成指南

24.

Keras

25.

——可解释或快速(或记忆效率)更重要。但随着时间的推移,这将很可能改变,因为人们将不再害怕黑盒子解决方案,并专注于准确性。

26.

——有时很难跟踪它。 这就是为什么你应该专注于任何算法的正确使用,而不是投资于一个。

27.

Smote

28.

“数据科学玩家”的任何人都需要接受教育,接受黑箱解决方案是完全正常的。 这可能需要一段时间,所以运行一些回归以及你正在做的任何其他建模可能会很好,并且通常会尝试提供说明图和总结信息,以便为您的模型为什么执行此操作。

29.

kaggle

30.scikit learn

“人们在说

31.

32.

vowpal wabbit

33.

  • 特征变换(例如将数字或分类变量转换为其他类型)
  • 特征选择
  • A
  • 处理空值
  • 处理异常值

34.

35.

https://www.kaggle.com/c/malware-classification/discussion/13863

https://blog.kaggle.com/2015/05/11/microsoft-malware-winners-interview-2nd-place-gert-marios-aka-kazanova/

https://github.com/kaz-Anova/ensemble_amazon

https://blog.kaggle.com/2015/12/03/dato-winners-interview-1st-place-mad-professors/

https://blog.kaggle.com/2016/04/08/homesite-quote-conversion-winners-write-up-1st-place-kazanova-faron-clobber/

https://mlwave.com/how-we-won-3rd-prize-in-crowdanalytix-copd-competition/

https://blog.kaggle.com/2016/08/31/avito-duplicate-ads-detection-winners-interview-2nd-place-team-the-quants-mikel-peter-marios-sonny/

https://blog.kaggle.com/2016/12/15/bosch-production-line-performance-competition-winners-interview-3rd-place-team-data-property-avengers-darragh-marios-mathias-stanislav/

36.

37.

看这里

38.

Weka


本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Winning Tips on Machine Learning Competitions by Kazanova, Current Kaggle #3》,作者:Team Machine Learning译者:tiamo_zn,审校:。

文章为简译,更为详细的内容,请查看原文

最后更新:2017-04-16 22:02:11

  上一篇:go 1.3—Spring基础配置—AOP
  下一篇:go 开源维护者Lawso:最让人火大的是哪类人?