行业资深专家切身经验——给数据科学家新手的建议
两年前,我在行业分享了个人从事数据科学的经历。本文原本是为了庆祝自己两年的推特纪念日而写的个人反思,但最终发表在Medium上,这是因为我相信它对许多有抱负的数据科学家是非常有用的。
很快就到了2017,我在Airbnb不到两年的工作时间里成为高级数据科学家。当回顾到目前为止的旅程并想象下一个来的是什么,我在再次写一些关于我早期职业生涯的一些认识。
如果我之前博文的目标受众是有抱负的数据科学家以及对这个领域完全陌生的人,那么本文是针对那些已经在数据科学这个领域刚刚起步的人。这篇文章的目标不仅是要用来提醒自己已经学到的重要的知识,同时也激励那些从事数据科学事业的人!
Philip Guo在他的博客“你在谁的关键路径上?”中阐述了以下观察:
DSL
Python,而是Python些例子:
- 如果你的目标是应用最新的、先进的统计方法,R语言可能是更好的选择。因为R是由统计人员为统计人员建立。每一周,在CRAN上有很多有趣的新的R包提供。
-
一方面,Python对于构建生产数据管道非常管用,因为它是一个通用的程序设计语言。例如,可以在蜂巢使用Python UDF轻易地构建一个scikit学习模型来做分布式评分。
虽然我没有在之前使用过Python,但我确实有不同的能力玩一种语言。然而,我从来没有真正正确学会Python基础,导致我害怕代码被分成相关的类别,我一直想知道,__init__ .py是用来做什么的。
””
-
PythonpandasAPI
-
-
— @
k
“有不满的想法,这并不意味着对世界悲观不满——我们不喜欢事情进行的方式是——我指的是一个建设性的不满。思想可以用文字表达,这虽好,但我认为事情可以做得更好。我想有一个更简洁的方法来做这件事,我认为情况会有所改善。换句话说,当事情看起来不太好时,需要有持续的轻微刺激;我认为”
k+1
——
[
Robert Chang一名高级数据科学家,现工作于Airbnb
Linkedin:https://www.linkedin.com/in/robert-chang-877b1720/
Medium:https://medium.com/@rchang
Twitter:https://twitter.com/_rchang
本文由北邮@爱可可-爱生活老师推荐,阿里云云栖社区组织翻译。
《Advice For New and Junior Data Scientists》,作者: Robert Chang
最后更新:2017-10-14 22:03:15