閱讀451 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《數據驅動安全:數據安全分析、可視化和儀表盤》一1.3.2 探索性數據分析

本節書摘來異步社區《數據驅動安全:數據安全分析、可視化和儀表盤》一書中的第1章 ,第1.3.2節,[美]傑·雅克布(Jay Jacobs)鮑布·魯迪斯(Bob Rudis) 著 薛傑 王占一 張卓 胡開勇 蔣夢颺 趙爽 譯, 更多章節內容可以訪問雲棲社區“異步社區”公眾號查看。

1.3.2 探索性數據分析

目前為止,我們已經解釋了應該如何開始進行良好的數據分析,接下來我們探討在真實世界中,事情一般是怎麼發生的。如果有了明確的研究問題以及幹淨無噪聲的數據,然後每天早晨先來一杯咖啡熱飲再開始一天的工作,這是十分愜意的。然而在真實生活中呢,我們經常不得處理一些為咖啡熱飲做準備的工作,會經常地開始疑問“這數據到底有什麼作用呢?”。這又將我們帶回到了John Tukey(出現在本章前部分),他開創了一個稱為探索性數據分析(exploratory data analysis,EDA)的數據處理過程,它有點像赤腳在數據裏邊或者周圍滾來滾去的過程,在這樣的過程學習數據中不同的變量,理解它們的含義以及它們與其他變量之間的關係。Tukey創造了一係列的技術方法來提高我們對數據的觀察力和理解能力,包括簡單優雅的莖葉圖、五數概括法,以及具有極大幫助的箱線圖。其中的每一種方法都會在本書後續章節講到。
一旦你對數據感到適應了,你就會很自然地詢問一些有關的問題,但是有很重要的一點,你要一直不斷地回過頭重新產生更加合適的研究問題。正如Tukey在其1997年出版的《Exploratory data analysis can never be the whole story》中所說,他將EDA視為數據分析過程的基石和第一步,他還提到“探索性數據分析是一種態度,一種靈活的狀態,一種找尋東西的信念,尋找那些我們認為既存在又不存在的東西。”有了這種想法,本書中的很多用例都使用了探索性分析。我們將用一種迭代的方法,當你在數據中穿行的時候會學到知識。最後呢,我們要謹記,數據分析是用來找尋那些值得探索的問題答案的。

最後更新:2017-06-21 17:31:58

  上一篇:go  《數據驅動安全:數據安全分析、可視化和儀表盤》一1.4 本章小結
  下一篇:go  《數據驅動安全:數據安全分析、可視化和儀表盤》一1.3.1 創建一個好的研究問題