73
Python
Python安裝中需要特別注意的一件事
默認安裝的Python開發環境已經附帶了很多高級數據類型,如列表、元組、字典、集合、隊列等,無需進一步編程就可以使用這些數據類型的操作。
使用這些數據類型使得實現抽象的數學概念非常簡單。此外,還可以使用自己熟悉的編程風格,如麵向對象編程、麵向過程編程、或者函數式編程。
Python語言的優勢
基於以下三個原因,選擇Python作為實現數據挖掘算法的編程語言:
(1) Python的語法清晰;
(2) 易於操作純文本文件;
(3) 使用廣泛,存在大量的開發文檔。
Python版本之爭
2.x版:現今有大量應用,而3.x版是今後的趨勢。
實現多版本共存與切換簡便方法:更改係統環境變量path
查看已安裝版本的方法(在所啟動的IDLE界麵也可以直接看到):
>>> import sys
>>> sys.version
'2.7.8 (default, Jun 30 2014, 16:08:48) [MSC v.1500 64 bit (AMD64)]'
>>> sys.version_info
sys.version_info(major=2, minor=7, micro=8, releaselevel='final', serial=0)
安裝Python
Python默認編程環境是IDLE,常用快捷鍵:
Alt+P、Alt+N:瀏覽曆史命令
Ctrl+F6:重啟Shell,之前定義的對象全部無效
F1:打開Python幫助文檔
Alt+/:自動補全前麵曾經出現過的單詞,在多個單詞中循環選擇
Ctrl+[、Ctrl+]:縮進代碼
Alt+3、Alt+4:注釋、取消注釋
使用pip管理第三方包
Python2中需要單獨安裝,安裝方法:cmd==>python get-pip.py
用法示例
pip install NumPy
pip list
pip install --upgrade SomePackage
pip uninstall SomePackage
需要特別注意的是,Python3安裝包中已默認包含pip。
Python語言處理和操作文本文件非常簡單,非常易於處理非數值型數據。
Python語言提供了豐富的正則表達式函數以及很多訪問Web頁麵的函數庫,使得從HTML中提取數據變得非常簡單直觀。
Python語言唯一的不足是性能問題。Python程序運行的效率不如Java或者C代碼高,但是可以使用Python調用C編譯的代碼。這樣,就可以同時利用C和Python的優點,逐步地開發數據挖掘應用程序。
最後更新:2017-10-10 10:25:40