Python高效編程技巧
我已經使用Python編程有多年了,即使今天我仍然驚奇於這種語言所能讓代碼表現出的整潔和對DRY編程原則的適用。這些年來的經曆讓我學到了很多的小技巧和知識,大多數是通過閱讀很流行的開源軟件,如Django, Flask, Requests中獲得的。
下麵我挑選出的這幾個技巧常常會被人們忽略,但它們在日常編程中能真正的給我們帶來不少幫助。
1. 字典推導(Dictionary comprehensions)和集合推導(Set comprehensions)
大多數的Python程序員都知道且使用過列表推導(list comprehensions)。如果你對list comprehensions概念不是很熟悉——一個list comprehension就是一個更簡短、簡潔的創建一個list的方法。
- >>> some_list = [1, 2, 3, 4, 5]
- >>> another_list = [ x + 1 for x in some_list ]
- >>> another_list
- [2, 3, 4, 5, 6]
自從python 3.1 (甚至是Python 2.7)起,我們可以用同樣的語法來創建集合和字典表:
- >>> # Set Comprehensions
- >>> some_list = [1, 2, 3, 4, 5, 2, 5, 1, 4, 8]
- >>> even_set = { x for x in some_list if x % 2 == 0 }
- >>> even_set
- set([8, 2, 4])
- >>> # Dict Comprehensions
- >>> d = { x: x % 2 == 0 for x in range(1, 11) }
- >>> d
- {1: False, 2: True, 3: False, 4: True, 5: False, 6: True, 7: False, 8: True, 9: False, 10: True}
在第一個例子裏,我們以some_list
為基礎,創建了一個具有不重複元素的集合,而且集合裏隻包含偶數。而在字典表的例子裏,我們創建了一個key是不重複的1到10之間的整數,value是布爾型,用來指示key是否是偶數。
這裏另外一個值得注意的事情是集合的字麵量表示法。我們可以簡單的用這種方法創建一個集合:
- >>> my_set = {1, 2, 1, 2, 3, 4}
- >>> my_set
- set([1, 2, 3, 4])
而不需要使用內置函數set()
。
2. 計數時使用Counter計數對象。
這聽起來顯而易見,但經常被人忘記。對於大多數程序員來說,數一個東西是一項很常見的任務,而且在大多數情況下並不是很有挑戰性的事情——這裏有幾種方法能更簡單的完成這種任務。
Python的collections類庫裏有個內置的dict
類的子類,是專門來幹這種事情的:
- >>> from collections import Counter
- >>> c = Counter('hello world')
- >>> c
- Counter({'l': 3, 'o': 2, ' ': 1, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})
- >>> c.most_common(2)
- [('l', 3), ('o', 2)]
3. 漂亮的打印出JSON
JSON是一種非常好的數據序列化的形式,被如今的各種API和web service大量的使用。使用python內置的json
處理,可以使JSON串具有一定的可讀性,但當遇到大型數據時,它表現成一個很長的、連續的一行時,人的肉眼就很難觀看了。
為了能讓JSON數據表現的更友好,我們可以使用indent
參數來輸出漂亮的JSON。當在控製台交互式編程或做日誌時,這尤其有用:
- >>> import json
- >>> print(json.dumps(data)) # No indention
- {"status": "OK", "count": 2, "results": [{"age": 27, "name": "Oz", "lactose_intolerant": true}, {"age": 29, "name": "Joe", "lactose_intolerant": false}]}
- >>> print(json.dumps(data, indent=2)) # With indention
- {
- "status": "OK",
- "count": 2,
- "results": [
- {
- "age": 27,
- "name": "Oz",
- "lactose_intolerant": true
- },
- {
- "age": 29,
- "name": "Joe",
- "lactose_intolerant": false
- }
- ]
- }
同樣,使用內置的pprint模塊,也可以讓其它任何東西打印輸出的更漂亮。
4. 創建一次性的、快速的小型web服務
有時候,我們需要在兩台機器或服務之間做一些簡便的、很基礎的RPC之類的交互。我們希望用一種簡單的方式使用B程序調用A程序裏的一個方法——有時是在另一台機器上。僅內部使用。
我並不鼓勵將這裏介紹的方法用在非內部的、一次性的編程中。我們可以使用一種叫做XML-RPC的協議 (相對應的是這個Python庫),來做這種事情。
下麵是一個使用SimpleXMLRPCServer
模塊建立一個快速的小的文件讀取服務器的例子:
- from SimpleXMLRPCServer import SimpleXMLRPCServer
- def file_reader(file_name):
- with open(file_name, 'r') as f:
- return f.read()
- server = SimpleXMLRPCServer(('localhost', 8000))
- server.register_introspection_functions()
- server.register_function(file_reader)
- server.serve_forever()
客戶端:
- import xmlrpclib
- proxy = xmlrpclib.ServerProxy('https://localhost:8000/')
- proxy.file_reader('/tmp/secret.txt')
我們這樣就得到了一個遠程文件讀取工具,沒有外部的依賴,隻有幾句代碼(當然,沒有任何安全措施,所以隻可以在家裏這樣做)。
5. Python神奇的開源社區
這裏我提到的幾個東西都是Python標準庫裏的,如果你安裝了Python,你就已經可以這樣使用了。而對於很多其它類型的任務,這裏有大量的社區維護的第三方庫可供你使用。下麵這個清單是我認為的好用且健壯的開源庫的必備條件:
好的開源庫必須…
- 包含一個很清楚的許可聲明,能適用於你的使用場景。
- 開發和維護工作很活躍(或,你能參與開發維護它。)
- 能夠簡單的使用pip安裝或反複部署。
- 有測試套件,具有足夠的測試覆蓋率。
如果你發現一個好的程序庫,符合你的要求,不要不好意思————大部分的開源項目都歡迎捐贈代碼和歡迎提供幫助——即使你不是一個Python高手。
最後更新:2017-04-03 22:30:57