關於數據科學的那些事
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
請收下這份關於人工智能的根目錄——博客整理係列(一)
答案是YES,你要的這些這裏全都有!數據科學的全部幹貨,全部都在這裏!
一.數據科學雜談篇:
摘要:從量化金融到機器學習,有哪些準備我們可以進行?
摘要:數據科學是一個熱門的領域,本文介紹數據科學家目前使用的一些熱門編程語言,主要是從通用性、性能等方麵分析,想入門的或行業研究者可以參考並發表一下自己的觀點哦。
摘要:本文是關於數據科學家麵試題的一些建議,希望能夠給大家一些啟發。
4. 經曆多個數據科學崗位後,對於數據科學麵試他分享了以下求職心得
摘要:作者擁有多份數據科學求職的經驗,現在分享給各位小夥伴。
5. 2017數據科學職位報告:R超過SAS,但仍不如Python
摘要:本文以美國最大的招聘網站Indeed.com為統計平台,通過對某一天數據科學職位的招聘數量進行統計分析,得出數據科學軟件的變化趨勢。
6. 第二熱門語言:從入門到精通,Python數據科學簡潔教程
摘要:本文介紹了一些常見的用於數據分析任務的Python庫,如Numpy、Pandas、Matplotlib、Scikit-learn以及BeautifulSoup等,這些工具庫功能強大,便於上手。有了這些幫助,數據分析會變得分外簡單。
7. 數據分析師的基本素養——論如何成為一名數據科學家 Part 1
摘要:本篇文章是Quora網站上"如何成為一名數據科學家"問題的高分答案集錦,來自不同領域的回答者結合自己的切身經驗,分享了對數據科學家成長之路的看法。本篇文章收錄了其中部分評價較高的回答,可為初學者了解或入門數據科學指明方向。
8. 數據分析師的基本素養——論如何成為一名數據科學家 Part 2
摘要:本篇文章是Quora網站上"如何成為一名數據科學家"問題的高分答案集錦,來自不同領域的回答者結合自己的切身經驗,分享了對數據科學家成長之路的看法。本篇文章收錄了其中部分評價較高的回答,可為初學者了解或入門數據科學指明方向。
摘要:本文是關於回歸知識的45道小問題,包括了理論和實踐知識,快來試一試~
10. 考察數據科學家數據降維知識的40道題,快來測測吧(附答案)
摘要:本文例舉了一個針對數據科學家的數據降維測試,測試總共有40道題,涉及的內容主要有PCA、t-SNE以及LDA降維技術。想檢驗下自己對降維技術掌握的情況就趕快測測吧。
11. 用機器學習研究UFO目擊報告!數據科學之魅:隱含狄利克雷分布
摘要:LDA算法太難?怎麼也學不明白?學明白了也不知道有什麼用?來看看這篇文章!真正的學以致用!
摘要:本文概述了學習數據挖掘與數據科學的七個步驟,每一步都給出了詳細的學習資源,便於初學者按照指南開展數據挖掘與數據科學的學習。
摘要:當開始進入數據科學領域時,我們可能會犯一些錯誤。本文羅列了9種初學者常見的錯誤,並提出避免犯錯的建議。
14. 矽穀資深數據科學家教你認清探索性數據分析(EDA)的價值
摘要:本文主要介紹了探索性數據分析的價值,說明了探索性數據分析(EDA)是什麼以及詳細介紹了兩種假設,另外文中分析了探索性數據分析對於建模而言是很重要的一步,能夠幫助數據科學家找到模型結果出錯的原因。
15:摩根大通機器學習與金融大數據指南——未來的華爾街大亨|大數據+機器學習+金融工程師
摘要:本文總結了J.P.摩根最新的280 頁研究報告中的13亮點,極為詳盡地梳理、預測了金融從業者未來都需要具備相關機器學習以及數據分析的能力,分析了金融行業的現狀與未來,對於金融從業者以及想從事金融行業者具有重要的借鑒意義。
二.數據科學實戰篇:
1. 了解人工智能之分類和預測 - 數據科學中的預測,分類和回歸分析
摘要:本文作者闡述了她對機器學習在數據分析學科方麵的應用現狀和展望。給了初涉這個領域的人們一個初步的介紹。
2.Python股市數據分析教程——學會它,或可以實現半“智能”炒股 (Part 1)
摘要:本篇文章是"Python股市數據分析"兩部曲中的第一部分,主要介紹金融數據分析的背景以及移動均線等方麵的內容。
3. Python股市數據分析教程——學會它,或可以實現半“智能”炒股 (Part 2)
摘要:本篇文章是"Python股市數據分析"兩部曲中的第二部分。在本篇文章中,我們討論了均線交叉策略的設計、回溯檢驗、基準測試以及實踐中可能出現的若幹問題,並結合Python代碼實現了一個基於均線交叉的交易策略係統。
4. 玩笑到現實,大數據涉足文學研究--用數據模型分析莎翁著作
摘要:自然語言研究一直以來都是計算機研究的一個重要方向。隨著大數據時代的到來,人們也越來越關注自然語言這方麵的進展。而文學是自然語言這個皇冠上的明珠。人們都拭目以待大數據摘下這顆明珠的那一天。
5. 成為技術高手:想更了解自己的偶像麼?教你用技術手段挖掘他/她的關係
摘要:是否在不同的電影中,總是能看到那些熟悉卻叫不上名字的演員麼,想知道他們之間相互的關係麼?本文將帶你一步一步地挖掘出他們的關係。想更了解自己的偶像麼,那就試試吧。
摘要:大數據時代,任何事件之間都可能具有一定的相關性。啤酒和尿不濕有關係嗎?今天就帶你來看一下,如何用Python來分析購物之間那些潛在的規則。
摘要:本文主要講述了如何在python中用七步就能完成中數據準備。
摘要:這篇博客主要介紹處理不平衡數據的技巧,給出了七種適用於特定問題及數據集的方法,避免由於數據集不平衡而得到的一個假的好模型。另外作者也指出本文不是一個技術列表,建議讀者不局限於此、嚐試結合不同的方法設計出合適的模型。
9. Vega數據可視化工具——教你輕鬆玩轉大數據可視化 | 附代碼
摘要:Vega是一種大數據可視化的高效工具,本文以分析遊隼的遷徙情況為例,展示了Vega工具的強大能力及易學易用特點。
摘要:概率分布在許多領域都很常見,包括保險、物理、工程、計算機科學甚至社會科學,如心理學和醫學。它易於應用,並應用很廣泛。本文重點介紹了日常生活中經常能遇到的六個重要分布,並解釋了它們的應用。
本係列由阿裏雲雲棲社區組織整理,翻譯小組袁虎負責整理,審閱:主題曲哥哥。本係列長期更新,社區更多關於數據科學的優質好文,多多推薦!
最後更新:2017-10-02 08:39:56