375
技術社區[雲棲]
行業資深專家切身經驗——給數據科學家新手的建議
兩年前,我在行業分享了個人從事數據科學的經曆。本文原本是為了慶祝自己兩年的推特紀念日而寫的個人反思,但最終發表在Medium上,這是因為我相信它對許多有抱負的數據科學家是非常有用的。
很快就到了2017,我在Airbnb不到兩年的工作時間裏成為高級數據科學家。當回顧到目前為止的旅程並想象下一個來的是什麼,我在再次寫一些關於我早期職業生涯的一些認識。
如果我之前博文的目標受眾是有抱負的數據科學家以及對這個領域完全陌生的人,那麼本文是針對那些已經在數據科學這個領域剛剛起步的人。這篇文章的目標不僅是要用來提醒自己已經學到的重要的知識,同時也激勵那些從事數據科學事業的人!
Philip Guo在他的博客“你在誰的關鍵路徑上?”中闡述了以下觀察:
DSL
Python,而是Python些例子:
- 如果你的目標是應用最新的、先進的統計方法,R語言可能是更好的選擇。因為R是由統計人員為統計人員建立。每一周,在CRAN上有很多有趣的新的R包提供。
-
一方麵,Python對於構建生產數據管道非常管用,因為它是一個通用的程序設計語言。例如,可以在蜂巢使用Python UDF輕易地構建一個scikit學習模型來做分布式評分。
雖然我沒有在之前使用過Python,但我確實有不同的能力玩一種語言。然而,我從來沒有真正正確學會Python基礎,導致我害怕代碼被分成相關的類別,我一直想知道,__init__ .py是用來做什麼的。
””
-
PythonpandasAPI
-
-
— @
k
“有不滿的想法,這並不意味著對世界悲觀不滿——我們不喜歡事情進行的方式是——我指的是一個建設性的不滿。思想可以用文字表達,這雖好,但我認為事情可以做得更好。我想有一個更簡潔的方法來做這件事,我認為情況會有所改善。換句話說,當事情看起來不太好時,需要有持續的輕微刺激;我認為”
k+1
——
[
Robert Chang一名高級數據科學家,現工作於Airbnb
Linkedin:https://www.linkedin.com/in/robert-chang-877b1720/
Medium:https://medium.com/@rchang
Twitter:https://twitter.com/_rchang
本文由北郵@愛可可-愛生活老師推薦,阿裏雲雲棲社區組織翻譯。
《Advice For New and Junior Data Scientists》,作者: Robert Chang
最後更新:2017-10-14 22:03:15