《數據驅動安全:數據安全分析、可視化和儀表盤》一2.3 數據幀介紹
本節書摘來異步社區《數據驅動安全:數據安全分析、可視化和儀表盤》一書中的第2章 ,第2.3節,[美]傑·雅克布(Jay Jacobs)鮑布·魯迪斯(Bob Rudis) 著 薛傑 王占一 張卓 胡開勇 蔣夢颺 趙爽 譯, 更多章節內容可以訪問雲棲社區“異步社區”公眾號查看。
2.3 數據幀介紹
如果了解其他編程語言,一定會對通用的數據類型有一些基本認識,例如字符串、整型以及數組。R和Python提供了標準的數據類型集合,它們有一個共同的數據類型:數據幀,它給予R和Python強大的功能。從表麵上看,數據幀僅僅是表現表格數據(標準的Excel電子表格中展示的數據類型)的一種方法,並且看上去像是二維數組。然而,如果深入剖析,就會發現數據幀是數據庫表、矩陣、二維數組以及具有許多額外的省時特性的數據透視表的一體化組合。
像數據庫表,每列在數據幀中有一個列名並擁有相同類型的數據元素。你可以在全列、全行以及各列/行子集中執行操作。增加、合並、扁平、擴展、修改、刪除以及查找等針對數據的操作在R和Python中都隻需要執行一行命令,就像從文件中讀出或寫入數據一樣。從本質上看,Python和R通過將這種理解力融合進數據結構和相應的函數以獲得了這項有表現力的功能。相反,其他編程語言缺少這種複雜的數據結構,這意味著你需要自己編寫代碼來建立自己的數據結構以獲得相似的功能。
下麵的代碼(程序清單2-1和程序清單2-2)分別提供了關於R和Python中數據幀操作的概述,但是仍強烈建議在進入第3章之前閱讀上述內容的資源。正如在前言中所指出的,可以在本書相應的網站(www.wiley.com/go/datadrivensecurity)獲得代碼。
程序清單2-1
對於大多數分析項目,數據幀是R和Python的核心數據結構。它使開發者專注於用數據來做什麼而不是如何做。這是特定領域編程語言和通用編程語言的主要區別之一。如果你曾經對轉向使用R或Python進行數據分析表示觀望,希望這個關於每種語言能力的簡單介紹能夠說服你。
最後更新:2017-06-21 17:32:13