我的大數據入門經驗
大數據基礎環境學習:
因為大數據相關技術很多,就說一下我自己的學習過程吧,希望能給大家一些幫助。我一開始是自己感興趣看了一些文章,也在本機用虛機搭了個環境自己自娛自樂,主要是用的CDH,把相關功能都用了一遍,有了第一印象。後來又參與了一個大數據項目的實施工作,有了實踐經驗,又把相關論文都重看了一遍,感覺自己算是入了門。後來有看了很多阿裏雲的資料,參加阿裏雲的培訓,通過學習飛天裏麵的各部分技術,比如盤古,伏羲,女媧等,感覺對於大數據技術又是一次互相印證。
我剛才看了一下,這部分的視頻,阿裏雲棲社區上還能找到,就是在阿裏雲大學的雲計算學習路線圖:
https://edu.aliyun.com/promotion/28?spm=5176.8764702.aliyun-edu-developer-banner.2.ibTeJX
的最後一部分:技術深入。這裏麵把大數據平台也是雲平台裏麵最關鍵的幾個技術都進行了深入淺出的說明,建議初學者去聽一下。包括:
分布式調度係統(6課時)
分布式存儲係統(15課時)
分布式數據庫(7課時)
分布式計算(9課時)
分布式係統應用架構(9課時)
算法學習:
現在機器學習及深度學習算法的資料很多,我看的部分內容包括:
書:李航的《數理統計》,周誌華的《機器學習》,《機器學習實踐應用》都不錯。還有《R in action》, 《利用Python進行數據分析》等等也都還可以。
網上資料:可以在阿裏雲棲社區上有無數的資料,可以看網易公開課上看吳恩達的《機器學習》,斯坦福的那幾門課程,GITHUB上看大神參加各個比賽的代碼。
可以說現在互聯網時代,資料是十分豐富的。不過我覺得要想真正掌握算法和技術,還是要多進行實踐。要是現在工作中沒有實際的應用可以做,參加大數據比賽也是一個不錯的辦法。我從今年初開始學習機器學習,一邊學習一邊參加天池比賽進行練習,整體效果還不錯,自己感覺進步很快。
最後更新:2017-11-15 17:34:20