《數據驅動安全:數據安全分析、可視化和儀表盤》一2.2 用Canopy快速開始Python分析
本節書摘來異步社區《數據驅動安全:數據安全分析、可視化和儀表盤》一書中的第2章 ,第2.1節,[美]傑·雅克布(Jay Jacobs)鮑布·魯迪斯(Bob Rudis) 著 薛傑 王占一 張卓 胡開勇 蔣夢颺 趙爽 譯, 更多章節內容可以訪問雲棲社區“異步社區”公眾號查看。
2.2 用Canopy快速開始Python分析
如果你熟悉和精通Python,通過我們提供的鏈接,可以快速可靠地安裝好Python、IPython和pandas,但是我們不建議這麼做。對於Python新手,基礎安裝包含了核心解釋器以及內置的標準擴展庫,就好比你已經有了便宜的畫板、基礎的塗料和畫筆,你需要更好的材料去創造藝術作品,統計、計算、畫圖的庫因此應運而生。即使是忠誠的Python擁護者也認為管理庫文件的依賴關係以及更新眾多的必要組件是一件很有挑戰性的工作。而這會浪費你的時間,尤其是當你需要在不同操作係統和環境下管理分析過程時。
為了安裝和維護方便,我們強烈建議使用開源軟件Enthought Canopy Python數據分析開發環境(www.enthought.com/products/canopy)。Canopy運行於Linux、Microsoft Windows以及Mac OSX,擁有一個內置的Python集成開發環境,結合一個元數據包管理器,能確保依賴包和模塊實時更新,並且和IPython一樣有個控製台。對於那些不想使用開源解決方案的組織,Enthought同樣提供Canopy的商業版本。
從(https://docs.enthought.com/canopy/quick-start.html)處能獲取完整的安裝、設置和升級指南,因此我們不會一步步介紹怎麼在不同平台下安裝Canopy,我們強烈建議在嚐試本書提供的任何Python代碼例子前先查看一遍文檔。當你完成基本安裝之後,打開Canopy應用程序,歡迎頁麵會顯示出來(見圖2-1)。
首先需要做的是指導Canopy在IPython控製台裏顯示所有圖像。這是可選的步驟,但可保證在Canopy環境下所有輸出能正確顯示。當你打開Canopy編輯器會話時,你可以從Preferences窗口裏找到Python標簽,選擇Inline(SVG)選項,來調整PyLAb Backend的偏好設置(見圖2-2)。
你可以在編輯器的IPython控製台裏運行如下代碼來驗證環境是否設置合適。
成功後的輸出如圖2-3所示。當完成這一切後,你已經搞定了基本的環境安裝設置,可以開始用數據分析的例子進行後續工作了。如果柱狀圖沒有顯示,你應該檢查你的安裝步驟,或者驗證剛剛提過的圖像顯示設置是否正常。
當一切都運轉正常時,你可以花10分鍾,仔細讀一下Stavros Korokithakis寫的《Learn Python in 10 Minutes》(www.stavros.io/tutorials/python)。如果你不熟悉Python了,你可以額外花10分鍾過一下《10 Minutes to Pandas》(https://pandas.pydata.org/pandas-doc/dev/10min.html),來了解一下pandas數據分析模塊。
最後更新:2017-06-21 17:32:04