阅读375 返回首页    go 阿里云 go 技术社区[云栖]


行业资深专家切身经验——给数据科学家新手的建议

https://yq.aliyun.com/cloud

81e77806e119653bfd57537a13ba2d97b6c22a00

两年前,我在行业分享了个人从事数据科学经历本文原本是为了庆祝自己两年的推特纪念日而写的个人反思,最终发表在Medium上,这是因为我相信它许多有抱负的数据科学家是非常有用的。

很快到了2017,我在Airbnb不到两年的工作时间里成为高级数据科学家。当回顾目前为止的旅程想象下一个来的是什么,我在再次写一些关于我早期职业生涯的一些认识。

如果我之前博文的目标受众是有抱负的数据科学家以及对这个领域完全陌生的人,那么本文是针对那些已经在数据科学这个领域刚刚起步的人。这篇文章的目标不仅是要用提醒自己已经学到重要的知识,同时也激励那些从事数据科学事业的人

Philip Guo在他的博客“你在谁的关键路径上?”中阐述了以下观察:

d3f0ca9243dd5542bca1158b0c484c01d8bd3bdc

项目,我很快意识到使用Python——到Python

9674380c2425af05a29a60b5e88045b52cceee15

DSL

Python,而是Python些例子:

  • 如果你的目标是应用最新的、先进的统计方法,R语言可能是更好的选择。因为R是由统计人员为统计人员建立。每一周,CRAN有很多有趣的新的R包提供。
  • 一方面,Python对于构建生产数据管道非常管用,因为它是一个通用的程序设计语言。例如,可以在蜂巢使用Python UDF轻易地构建一个scikit学习模型做分布式评分。

虽然我没有之前使用Python,但确实有不同的能力玩一种语言。然而,我从来没有真正正确学会Python基础,导致我害怕代码被分成相关的我一直想知道,__init__ .py是用来做什么的

02ff9be05ccc6b61bf46dcfecfd24ee22264ca39

e84208c5b860cd80d865ce2b892d8a033cb6cede

                    — @

k

Claude Shannon

96bf1d6aba9450ef1e9d9e43eccaf2b8d492d410

“有不满的想法,这并不意味着对世界悲观不满——我们不喜欢事情进行的方式是——我指的是一个建设性的不满。思想可以用文字表达,这虽好,但我认为事情可以做得更好。我想有一个更简洁的方法来做这件事,我认为情况会有所改善。换句话说,当事情看起来不太好时,需要有持续的轻微刺激;我认为

k+1

——

”,也可以

[



77a06740841c419341f01e3adf318a776bb1ac75

Robert Chang一名高级数据科学家,现工作于Airbnb

Linkedinhttps://www.linkedin.com/in/robert-chang-877b1720/

Medium:https://medium.com/@rchang

Twitter:https://twitter.com/_rchang

本文由北邮@爱可可-爱生活老师推荐,阿里云云栖社区组织翻译。

Advice For New and Junior Data Scientists》,作者: Robert Chang

 

 

最后更新:2017-10-14 22:03:15

  上一篇:go  如何从出行无线覆盖到智慧交通演变,锐捷智慧交通解决方案有一套
  下一篇:go  网站建设推荐使用阿里云ECS服务器 优惠券免费领取及使用心得