閱讀514 返回首頁    go gooseeker集搜客


Python數據分析學習路徑圖


      由於Python擁有非常豐富的庫,使其在數據分析領域也有廣泛的應用。由於Python本身有十分廣泛的應用,本期Python數據分析路線圖主要從數據分析從業人員的角度講述Python數據分析路線圖。整個路線圖計劃分成16周,120天左右。主要學習內容包括四大部分: 
1)Python工作環境及基礎語法知識了解(包括正則表達式相關知識學習);
2)數據采集相關知識(python爬蟲相關知識);
3)數據分析學習;
4)數據可視化學習。



Python工作環境及基礎語法知識了解

      對於Python基礎語法學習部分,學習周期大概為4周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:

1.python工作集成環境包 
  • Python(x,y):下載地址:https://python-xy.github.io/downloads.html 
  • Pycharm:下載地址:https://www.jetbrains.com/pycharm/download/#section=windows 

2.python數據分析相關庫(Pandas/Numpy/Scipy/Matplotlib) 
      如果安裝了上麵集成工作包,則下麵的包不需要重新安裝了。關於包的安裝方法在學習資源圖書中都有介紹,通常安裝庫采用pip方法,也可以用pip list查詢係統安裝了哪些庫。

3.學習資源
  • 圖書: 
1)Python基礎教程(第2版)
2)深入淺出Head First python(中文版)

  • 在線教程: 
1)廖雪峰的python教程:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
2)正則式學習:https://wiki.jikexueyuan.com/project/python-crawler-guide/regular-expressions.html#7907ec6cc04be6c7f8cf8ac272215946

  • 視頻教程: 
1)慕課網python入門:https://www.imooc.com/learn/177
2)慕課網python進階:https://www.imooc.com/learn/317
3)正則式學習視頻:https://www.imooc.com/learn/550

數據采集學習

      對於數據采集部分的學習主要是通過python爬蟲的學習了解基本的外部數據采集情況,當然也可以借助別人寫好的規則庫直接完成某些數據的采集。這部分內容的學習周期大概也為四周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:
  • GooSeeker的開源Python即時網絡爬蟲:
1.開源Python爬蟲的技術資料:https://www.gooseeker.com/doc/thread-1824-1-1.html 2.開源Python爬蟲的討論社區:https://www.gooseeker.com/doc/forum-59-1.html
  • 爬蟲學習在線教程: 
1.Python爬蟲入門一之綜述:https://cuiqingcai.com/927.html
2.Python爬蟲入門二之爬蟲基礎了解:https://cuiqingcai.com/942.html
3.Python爬蟲入門三之Urllib庫的基本使用:https://cuiqingcai.com/947.html
4.Python爬蟲入門四之Urllib庫的高級用法:https://cuiqingcai.com/954.html
5.Python爬蟲入門五之URLError異常處理:https://cuiqingcai.com/961.html
6.Python爬蟲入門六之Cookie的使用:https://cuiqingcai.com/968.html
7.Python爬蟲入門七之正則表達式:https://cuiqingcai.com/977.html
8.Python爬蟲實戰一之爬取糗事百科段子:https://cuiqingcai.com/990.html
9.Python爬蟲實戰二之爬取百度貼吧帖子:https://cuiqingcai.com/993.html
10.Python爬蟲實戰三之計算大學本學期績點:https://cuiqingcai.com/997.html
11.Python爬蟲實戰四之抓取淘寶MM照片::https://cuiqingcai.com/1001.html
12.Python爬蟲進階一之爬蟲框架Scrapy安裝配置:https://cuiqingcai.com/912.html
  • 視頻教程: 
Python簡單爬蟲開發:https://www.imooc.com/learn/563

數據分析


      Python數據分析的學習主要是對相關庫的使用,比如數據整理需要用到numpy和pandas庫,數據描述與分析分析則主要用到pandas庫,從某種程度上講,利用python進行數據分析的學習過程就是對庫的學習過程。由於有了前麵2部分內容的學習基礎,本部分內容的建議學習練習時間也為4周,相關免費學習資源如下:
  • 圖書: 
利用python進行數據分析
  • 視頻: 
用python玩轉數據:https://www.coursera.org/learn/hipython

數據可視化

      Python數據可視化學習的過程就是學習matplotlib庫的過程,matplotlib庫包含有豐富的數據可視化資源,地圖、3D等等都有涉及,如果有前麵3部分的學習經驗的話,這部分內容在4周內也能解決。相關中文學習資源如下:
  • 圖書: 
Python數據可視化編程實戰
  • 在線教程: 
1.利用Python繪圖和可視化(1):https://www.lovedata.cn/ec/Python/2016/0118/7732.html
2.利用Python繪圖和可視化(2):https://www.lovedata.cn/ec/Python/2016/0118/7733.html

      至此,Python數據分析相關學習內容介紹完了,上麵介紹的多種資源,每個階段隻需選擇其中的一種進行深入即可,更多更深的內容則需要自己去實踐摸索。

最後更新:2017-01-09 14:08:11

  上一篇:go 集搜客網絡爬蟲的核心名詞
  下一篇:go Scrapy:Python3下的第一次運行測試