閱讀375 返回首頁    go 技術社區[雲棲]


行業資深專家切身經驗——給數據科學家新手的建議

https://yq.aliyun.com/cloud

81e77806e119653bfd57537a13ba2d97b6c22a00

兩年前,我在行業分享了個人從事數據科學經曆本文原本是為了慶祝自己兩年的推特紀念日而寫的個人反思,最終發表在Medium上,這是因為我相信它許多有抱負的數據科學家是非常有用的。

很快到了2017,我在Airbnb不到兩年的工作時間裏成為高級數據科學家。當回顧目前為止的旅程想象下一個來的是什麼,我在再次寫一些關於我早期職業生涯的一些認識。

如果我之前博文的目標受眾是有抱負的數據科學家以及對這個領域完全陌生的人,那麼本文是針對那些已經在數據科學這個領域剛剛起步的人。這篇文章的目標不僅是要用提醒自己已經學到重要的知識,同時也激勵那些從事數據科學事業的人

Philip Guo在他的博客“你在誰的關鍵路徑上?”中闡述了以下觀察:

d3f0ca9243dd5542bca1158b0c484c01d8bd3bdc

項目,我很快意識到使用Python——到Python

9674380c2425af05a29a60b5e88045b52cceee15

DSL

Python,而是Python些例子:

  • 如果你的目標是應用最新的、先進的統計方法,R語言可能是更好的選擇。因為R是由統計人員為統計人員建立。每一周,CRAN有很多有趣的新的R包提供。
  • 一方麵,Python對於構建生產數據管道非常管用,因為它是一個通用的程序設計語言。例如,可以在蜂巢使用Python UDF輕易地構建一個scikit學習模型做分布式評分。

雖然我沒有之前使用Python,但確實有不同的能力玩一種語言。然而,我從來沒有真正正確學會Python基礎,導致我害怕代碼被分成相關的我一直想知道,__init__ .py是用來做什麼的

02ff9be05ccc6b61bf46dcfecfd24ee22264ca39

e84208c5b860cd80d865ce2b892d8a033cb6cede

                    — @

k

Claude Shannon

96bf1d6aba9450ef1e9d9e43eccaf2b8d492d410

“有不滿的想法,這並不意味著對世界悲觀不滿——我們不喜歡事情進行的方式是——我指的是一個建設性的不滿。思想可以用文字表達,這雖好,但我認為事情可以做得更好。我想有一個更簡潔的方法來做這件事,我認為情況會有所改善。換句話說,當事情看起來不太好時,需要有持續的輕微刺激;我認為

k+1

——

”,也可以

[



77a06740841c419341f01e3adf318a776bb1ac75

Robert Chang一名高級數據科學家,現工作於Airbnb

Linkedinhttps://www.linkedin.com/in/robert-chang-877b1720/

Medium:https://medium.com/@rchang

Twitter:https://twitter.com/_rchang

本文由北郵@愛可可-愛生活老師推薦,阿裏雲雲棲社區組織翻譯。

Advice For New and Junior Data Scientists》,作者: Robert Chang

 

 

最後更新:2017-10-14 22:03:15

  上一篇:go  如何從出行無線覆蓋到智慧交通演變,銳捷智慧交通解決方案有一套
  下一篇:go  網站建設推薦使用阿裏雲ECS服務器 優惠券免費領取及使用心得