閱讀959 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《數據驅動安全:數據安全分析、可視化和儀表盤》一1.2.3 數據管理

本節書摘來異步社區《數據驅動安全:數據安全分析、可視化和儀表盤》一書中的第1章 ,第1.2.3節,[美]傑·雅克布(Jay Jacobs)鮑布·魯迪斯(Bob Rudis) 著 薛傑 王占一 張卓 胡開勇 蔣夢颺 趙爽 譯, 更多章節內容可以訪問雲棲社區“異步社區”公眾號查看。

1.2.3 數據管理

如果某種技能可以推遲學習,那就是數據管理,但你也僅僅將其短時間推遲。在信息安全(或者大多數其他行業)中,數據將會快速成倍地增加。如果你不學習怎麼管理它,它不斷擴大會影響工作的效率和效果。正如我們提到的,你可以利用電子表格來處理簡單的分析任務。你需要盡快擺脫這個階段,使用編程語言來解析數據,處理簡單格式的數據文件,例如逗號分隔數值(CSV)格式。到了這一步,你可能會看到一些將數據遷移到數據庫中的好處,但是目前不是必需的。
隨著數據倉庫的增長,你會到達一個數據複雜性或者數量級的臨界點,將數據遷移到一個更健壯的數據管理解決方案勢在必行。這裏存在一個誤解,將昔日大型的關係型數據庫留給量級最大的項目,這個觀念是不好的。將在第8章討論的大多數數據庫係統都可以安裝到個人電腦上,這樣可使數據分析更加有效,更具可擴展性。一旦你的數據管理技能變得得心應手,就連小的項目也會受益於此。我們已經安裝了一個本地數據庫,並且就連小的一次性項目的數據也一並導入了。
每當討論到數據管理技能時,我們很自然地就會想到數據庫,你期望有足夠的知識來安裝一個關係型數據庫或者NoSQL數據庫,以便導入數據,並用來做數據分析。但是,數據管理可不止數據庫的使用,前者還包括如何控製數據的質量和保證數據的完整性。你需要保證處理的數據沒有被無意識地修改或損壞。經常性地檢測數據質量和完整性無傷大雅,特別是針對長期的數據分析任務。它有點像軟件開發過程中的單元測試過程,將應用中可測試的最小片的功能代碼和整體代碼隔離,並檢測這小片代碼是否如預期一樣。在導入新數據或者做了數據轉換之後,你需要做一些自動的數據完整性檢查,特別是數據分析有了一定的效果,能進行定期的度量或者可用作控製的指標的時候。
最後,我們是關注信息安全的,如果我們沒有談到一點兒數據安全的話,就是我們的疏忽了。首先我們回頭看看上邊的內容,我們似乎重複強調了一些特點:一些出色的人員被他們的激情驅使決心要生成一個優雅的解決方案,但是係統安全並不是他們主要關注的問題,滿足功能需求才是主要的關注點。舉個例子,當UNIX平台係統最開始被開發出來的時候,其本意是為用戶提供共享的平台(同時也是封閉的平台)。其結果是大多數的認證和權限校驗隻是防止係統受到程序中無意識的錯誤產生的危害,而並沒有防止惡意的用戶。這裏的觀點是,一般“新生的”技術會特別強調功能性,而不是那麼關注安全性。
由於當前來勢洶洶的數據革命的快節奏推動,我們肯定要更多地強調功能性,而不是安全性。一些新的數據管理平台如Hadoop以及NoSQL,最開始都是被設計用來解決數據問題,而不能滿足很多企業的安全策略和合規性需求(雖然他們學習起來很快),而結果就是,分布式計算平台麵臨著不同的安全挑戰。現在UNIX的認證和安全特性比早期好太多了,他們通常不對安裝較多的關係型數據庫的安全性和功能特性進行比較,我們也不會在這個問題上關注太多。但是,不管選擇什麼數據管理平台,千萬別假想其已經考慮了安全問題。

最後更新:2017-06-21 17:02:43

  上一篇:go  《數據驅動安全:數據安全分析、可視化和儀表盤》一1.2.4 統計學
  下一篇:go  《數據驅動安全:數據安全分析、可視化和儀表盤》一1.2.2 編程技能