451
Python
全棧數據工程師養成攻略:Python 基本語法
作者 宏倫工作室
本文轉自簡書,轉載需授權
Python簡單易學,但又博大精深。許多人號稱精通Python,卻不會寫Pythonic的代碼,對很多常用包的使用也並不熟悉。學海無涯,我們先來了解一些Python中最基本的內容。
Python的特點
解釋型語言,無需編譯即可運行
提供了交互式命令行
基於對象的編程思想
跨平台和良好的兼容性,在Windows、Mac、Linux上都可運行
簡單好用而且功能強大
中文編碼
很多同學在打開數據時會遇上亂碼問題,其原因是字符集的編碼問題。Linux和Mac默認的編碼集是UTF8,而Windows則是ASCII。如果數據編碼的字符集,和你使用Python進行處理時所用的字符集不同,則會出現亂碼問題。
這裏是一篇參考文章,https://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html,詳細地介紹了Python中文編碼所涉及的內容。
另外,我個人的習慣是在Python代碼的頭部加入以下內容,其中第二行聲明了使用UTF8字符集。
變量
Python中的變量可以看作是一個個容器,裏麵存放著我們需要使用到的值。Python對變量名的要求和其他語言一樣:可以包括英文、數字以及下劃線,但不能以數字開頭,區分大小寫。當然我推薦,變量名用純英文就很好,並且取一些有意義的名稱,便於自己理解每個變量的作用。
Python是一門弱類型的語言,在使用變量時無需聲明其類型。Python中的變量包括以下幾類:數值、字符串、列表、元組、字典。
數值
數值包括整型和浮點型,分別對應整數和浮點數,後者精度更高。
字符串也就是我們經常接觸到的文本,可以往裏麵放任意長度的內容,用單引號或雙引號括起來。應當注意,中文以及中文符號隻能出現在字符串內,如果在下麵第三行中使用了中文輸入法的逗號 , ,Python將報錯。
使用 + 可以拚接兩個字符串。
使用 len() 可以得到字符串的長度。
使用切片可以訪問字符串中的某個字符或某個片段。
列表
列表好比一條隊伍,裏麵依次存放著多個變量。列表和字符串類似,但字符串中的每個元素都是字符,而列表中的每個元素可以是任意類型的變量。
使用 len() 可以獲得列表的長度。
列表元素的按下標訪問和賦值等操作,和字符串都是類似的。
使用 del 刪除列表中的某個元素。
元組
元組和列表類似,唯一的不同是元組中的元素在初始化之後不能再更改,因此可以理解成一個隻讀的變量。
字典
字典是一種極為重要的變量類型,使用一個key來訪問相應的value,即一種鍵值對的數據形式。
所以能夠總結出字典和列表的不同。列表中的元素是有序對等的,所以是用下標來賦值和訪問,而字典中的元素是無序的,所以是用key來操作相應的value。
使用 has_key() 判斷字典中是否有某個key。
如果訪問不存在的key,Python將會報錯。在賦值的時候,如果key已經存在,則會用新的value覆蓋已有的value。
注釋
被注釋的代碼將不會運行,可以看作是寫給自己和其他程序猿閱讀的一些筆記和說明,提高代碼可讀性。
在Sublime中,選中需要注釋的內容,按Ctrl+/即可完成注釋。
保留字符
在Python中,有一些字符串具有某些特定功能,如 import 、 class 等。我們在選擇變量名時,應注意避開這些保留字符。
行和縮進
在Python中,代碼塊的邊界不是通過大括號等符號進行顯式劃分,而是通過行的縮進實現的。連續相同縮進水平的代碼處於同一個代碼塊,在使用 for 、 while 、 if 、 try 等語法時需要注意每行代碼的縮進。
運算符
運算符的作用是根據已有的變量生成新的變量,主要有以下幾種:
算術運算符:+,-,*,/,%,即加、減、乘、除、取餘
比較運算符:==,!=,>,=,
賦值運算符:=,+=,-=,*=,/=,%=,即賦值、加賦值、減賦值、乘賦值、除賦值、取餘賦值
邏輯運算符:and,or,not,即與、或、非
條件
在寫代碼的時候,往往需要根據某些條件進行判斷,並根據判斷結果執行不同的分支代碼。
需要注意的是,但凡出現了 if 和 elif ,就需要加上相應的條件判斷,並且注意代碼的縮進。
在Sublime中輸入 if 會出現相應的提示,可以方便地補全代碼,在換行時光標也會自動跳到合適的縮進處。
循環
如果需要打印從1到100的100個數,肯定不會傻傻地寫100行print代碼,而是會用循環來處理類似的重複性工作。
while 循環
while 循環的思想是,隻要某一條件成立,就不斷執行循環體裏的代碼,直到條件不再成立。
for 循環
for 循環的循環次數一般是事先預知的,將一個標誌變量從某個起始值迭代到某個終止值後即結束。
循環控製
循環控製主要包括三種:
pass 表示什麼也不做,隻是占一行代碼的位置;continue 表示立即退出本輪循環,繼續執行後續輪循環;break 表示立即推出循環,後續循環也不再執行。
時間
在處理數據時,很多地方都會涉及到時間,例如數據產生的時間。
先介紹一下時間戳的概念,時間戳指的是從1970年1月1日0時0分0秒開始,到某一時刻所經曆的秒數,可以是整數或者小數,後者的精度更高。
為什麼需要時間戳這樣的一個概念?因為對於同一個時刻,不同人的描述可能不同,畢竟文本的形式千變萬化,而時間戳使得時間的表達得到了統一,每個時刻隻能用唯一的整數或浮點數來表示,同時也便於計算時間差這樣的處理。
關於時間戳,最常用的處理便是時間戳和時間文本之間的轉換,例如將 2016年10月1日 10時0分0秒 轉為時間戳。
其中, 等都是時間字段,前者表示四位的年份,後者表示兩位的月份。
文件
文件操作包括向文件中寫內容,以及從文件中讀內容,使用 open() 打開一個文件。
異常
Python代碼中可能會出現一些可以預知的問題,例如字典訪問的key不存在。如果不加處理,發生問題的時候Python便會報錯並退出,可能之前跑了很久又要重頭再來。因此,我們需要對可能出現的異常進行捕捉和處理。異常的結構由 try 、 except 、 else 、 finally 四部分組成。
函數
函數的作用是代碼模塊化,將可重用的代碼封裝成一個函數,這樣在需要使用的時候就隻需調用寫好的函數即可,而不用重新寫一遍代碼。
函數的使用包括兩個部分,函數的定義和函數的調用。除此之外,函數可以有一個或多個參數,參數之間以逗號分開,為函數的功能提供更多的靈活性。
補充學習
以上所介紹的,都是Python中最基礎和最常用的內容,先掌握這些就可以跟上後續章節。
最後更新:2017-10-08 16:10:06