閱讀528 返回首頁    go 技術社區[雲棲]


還在把可視化當佐證觀點的畫圖軟件?你需要這份進階攻略


0?wx_fmt=jpeg

隨著數據大環境(data climate)越來越快地發展,數據可視化的趨勢永遠在轉變和變化。在過去五年、當下或更遠的未來,我們處於什麼位置?一些重要的事情正在發生……

數據的意義

讓我們從如何思考及如何處理數據開始,下麵的數據演化流已經清楚地展示了這個流程:

0?wx_fmt=png

簡單地說,從原始數據開始。原始數據是指被感應器、人類或其它任何方式記錄下來的數據,它們以其原始的形式(數字、符號或文字)存儲下來。第二步,將數據以表、列和電子表格的形式組織起來,那樣我們能夠開始理解數據。這個步驟一旦開始後,我們可通過提供上下文細節,將處理過的數據轉化為信息位,以解釋某些數據點的意義,以及它們之間是如何關聯的。這之後,數據被定型,一旦我能夠感知那些信息、理解它,並且和我之前的記憶與經驗相聯係在一起後,我就獲得了知識。這最終給了我智慧,以讓我根據來自原始數據點的那些知識做出未來的決策。

我也認為數據演化流和在如今的數據可視化世界中事物如何發展之間存在鬆散的相關性。

首先我想分享一些利用數據可視化獲得洞察的例子,數據是形成理解的基礎,也能夠讓下次決策變得更加明智。


數據的關聯性:1986年挑戰者號災難


0?wx_fmt=png

我非常清楚地記得第一次看到愛德華·塔夫特出版的《視覺的解釋》(Visual Explanation)一書中這篇文章的情形,我永遠不會忘記。我多次用這個例子是因為它證明了理解數據、選擇正確數據點的重要性。

作為事故調查的一部分,那些負責允許飛船發射的人員給出了以下數據作為證據,表明他們無法預測危險。想到這些火箭工程師被認為是地球上最聰明的人,令人感到吃驚的是他們認為用這種格式展示他們的案例已經足夠好了。

0?wx_fmt=png

作為他們統計證據的一部分,工程師們隻在25架可發射的火箭中查看了9架,並且限於一個很小的技術因素範圍內。但是最重要的問題是似乎沒有人將火箭發射失敗與發射當天的氣溫聯係起來。

塔夫特重新設計了圖表,專注於準確的相關性。0?wx_fmt=png

正如你所見,挑戰者號發射時的氣溫大約為27華氏度,這一溫度低於最低的發射溫度,剛好是會造成(火箭)受損的最高指數。

圖中還清楚地顯示,氣溫越高對火箭損害的越小。現在,你可以說這張圖看起來完全不像“火箭科學”,它隻是證實了發現最具關聯性的數據並不總是那樣直截了當的。許多人說,塔夫特的案例忽略了涉及到的數據與物理的大部分複雜性,但是在我眼中這仍是一個重要的教訓。

美國海洋學家和製圖師馬修·莫裏所從事的一項早期大數據項目是一個很好的例子。他匯聚了數以萬計航海日誌中的數據而編製了第一部海洋地圖集。

0?wx_fmt=png

它的重要性在於其幫助船隻更快、更安全地到達目的地。如果你能更快地到達,意味著你能夠在戰爭或商業上占取先機。


領英的網絡可視化圖:承認複雜性

在過去五年左右的時間中,我們看到了諸多可視化利用了這個想法。像這張領英的網絡可視化圖,描述了社交網絡令人驚訝的複雜性。 它隻對處理後的數據(數據演變圖)進行了可視化,但可以說它並沒有將數據轉化為有意義的信息。

0?wx_fmt=png

如果你把數據可視化看做設計世界中的新範式,那種展示數據力量的想法是完全有意義的。全都是關於證明你擁有數據、有權訪問它、可以理解它或是說你有能力操縱它。

另一個例子是布倫丹·達文斯為EE完成的作品,該作品展示了人們在城市生活的一天中談論的內容。這些可視化的有趣性在於承認複雜性。他們幾乎把這些當作榮譽勳章而戴上。

0?wx_fmt=png

0?wx_fmt=png

一些人說它們比其它東西更有藝術性。它們很漂亮,不要誤會我,我認為用無形的數據世界來吸引觀看者是絕對至關重要的,以此來獲得它們在數據文化演變中應有的地位。然而,我們當然可以說,這樣的可視化,實際上很難讓我們從中獲得知識或洞見。

早期交互式的數據可視化例子也存在著類似的爭議。十年前數據可視化的基本原理是一屏顯示全部的數據集,然後通過動態的篩選來審視數據,就像本·福瑞的這個例子一樣。本·福瑞研究兩位被測試者的DNA模式。作為新手來說,很難從這些可視化圖中獲得任何知識。當然,這類工具的主要受眾是內容專家。此外,這一類探索仍然為數據可視化的演變帶來了巨大的貢獻。

0?wx_fmt=png

0?wx_fmt=png

新探索:數據新聞

我們也開始看到數據新聞領域中一些有趣的探索,現在已經算是流行了許多年的一種趨勢。這裏的方法提供了豐富的數據可視化,但是與此同時為讀者提供上下文信息。這是考慮了終端用戶,也就是下麵案例中的意大利雜誌IL的讀者。

0?wx_fmt=png

隨著更廣泛的受眾對數據解釋渴望的增加,為非專家用戶編輯數據真的有助於他們理解更廣泛的內容,從而獲取有意義的信息。

越來越多的實體開始以同樣的方式展示它們的數據,其中包括Bloomberg的例子。這是一篇交互式的文章,引導用戶通過一組特定的數據來了解美國人的死因。使用交互版本更有效的是信息可以排序並以敘述的方式展示。除了上下文信息,可以突出特定數據點為讀者創建重點,反過來減少了一些複雜性。

0?wx_fmt=png

0?wx_fmt=png


數據可視化和UI/UX設計的交叉點

我認為我們正在見證一個令人興奮的轉折點,那就是使用跨學科的技能去創建更逼真、更直觀、更豐富的數據驅動的用戶體驗。這正是我們在Signal Noise所采用的方法。這絕不是什麼新概念,一如既往,偉大的想法得到普遍的認可是需要時間的。我們開始更加習慣數據和數據的展示,至少部分是因為本·施奈德曼的工作,早在90年代他便先驅性地開創了諸多這類想法。

0?wx_fmt=png

為了理解任何較大的數據集,我們需要考慮人是如何感知信息、以及如何才能使我們更好地處理信息。在非常複雜的數據分析軟件Spotfire上的施奈德曼的工作可能是最成功的。他還開發了一套原則,從開始創建概覽、然後是縮放、篩選,最終提供所需的細節。先展示數據點的全部圖譜,這樣你就可以快速地定義極值、邊界值和均值的位置。當你有個小錯誤時,第二步就是對引起了你注意的個別數據點進行更進一步的調查。隨著你對所選數據點或內容有了更多的發現,你就能以更大粒度更進一步根據需要審視數據。

接下來的幾組例子更是很好地證明了這一點。我認為目前數據新聞正處於數據可視化前沿,特別是來自《紐約時報》的。

0?wx_fmt=png

0?wx_fmt=png

0?wx_fmt=png

這個例子非常適用於施耐德的口頭禪。這篇文章用255張圖表解釋在經濟衰退時如何重塑經濟。這聽起來很可怕,當然,看起來也有大量的數據點。你最先看到的是在同一刻度上所有圖表疊加的概覽,讓你看到所有的異常值、極端值。每個圖表顯示一個不同行業的工作數量。綠色表示增加,紅色為減少。

隨著你向下滑動,可視化會展開,圖表擴大。因此,你可以單獨地看每一個圖表。就像在Bloomberg的例子中那樣,它們以編輯內容的形式提供額外的上下文信息,拖拽出特定的圖表通過數據引導讀者。因此滑動整個圖表可以看到從全局到縮放、篩選,最後到所需的更多信息。正如施耐德所宣傳的那樣。

移至財務部分,一個運作得非常好的,當然也給我個人提供了大量靈感的例子便是這個CMC市場的金融交易平台。這個極其豐富和整體化的平台花了幾年開發成功,但我認為他們對金融股票數據的可視化和溝通形式幾乎都正確。

0?wx_fmt=png

考慮一下用戶類型。從業餘人士到專家的任何人都需要能夠使用這個平台來做出明智的決定來選擇股票和進行交易活動。而這關鍵是大量定製界麵的能力。你可以選擇看看單個指數圖表,它有時是多個(有時是幾千個)股票的展示,為的是理解或預測在該指數圖表中的某個股票的走勢。同樣你可以一次看12張 圖表,其中混合著一些情緒信息。這取決於用戶想要在任何給定的點上所消耗的信息量。 

交互式和直觀的界麵元素,如滑塊、允許用戶調整某些參數,理解他們的投資組合也許會被怎樣影響到。以新聞形式出現的提示性信息或警告幫助用戶更好地理解市場中發生的事。把所有事情組合在一起,你會得到極其豐富的數據體驗。我認為這是精準的合並數據可視化和我們看到更多的UI/UX專業知識的方法。我們稱之為“數據設計”(Data Design)。

進一步談到定製,我認為我們將很快看到更多的個性化信息。


相互聯係的生活

隨著我們的生活有著越來越多的聯係,我們會看到更多以自我為中心的數據可視化。想一下智能設備以及它們改進的速度有多快,在它們會認識你並能夠反映你的生活這點上會因為數據展示的形式而變得有趣。在先前的例子中,你需要額外的上下文信息去提取含義,對於個人數據來說這不再那麼必要。當你看到你手機上的步數,你直接就理解了它與你的動作如何關聯。同樣,你不再需要像Nest的智能調溫器包含著很多上下文信息,因為你在特定的環境中使用它,其中顯示的數據是顯而易見的。反過來,我們就能夠將那些需要配合多個用戶類型和用戶需求的所有不必要信息去掉。這裏的挑戰是設計出用戶可以識別出屬於他們自己的數據,我們稱之為“告訴我你認識我”。

0?wx_fmt=png

這導致我最後的一個例子更具隱喻性。在多數創意行業,一切都在繞圈子,我們常常是在極繁和極簡之間輪回。我認為我們現在介於兩者之間,開始從那些複雜的可視化轉向更簡潔、更少的可視化世界。

0?wx_fmt=png

這是Hammerhead廠家給騎行愛好者設計的導航設備。顯然,你在騎車時不想受到手機的幹擾。這個設備根據你的設置使用簡單的幾個LED燈來跟蹤你的路徑,告訴你前方有轉彎。全設備隻有一個按鈕,當你看到一個坑你便可以按下它。之後其他用戶經過此地時,也將會收到一個警示。

許多數據、許多洞見,但是隻有極少極少的反饋。這全是關於在對的地點、對的時間給用戶傳遞正確的信息。

這是作為數據設計師將要探索的方向:世界變得越來越複雜,我們將要探索出一條更簡單的路徑去理解環繞著我們的數據。

原文發布時間為:2017-04-19

本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號

最後更新:2017-05-17 13:33:22

  上一篇:go  信息圖 | 全世界70億人在做些什麼?
  下一篇:go  基於數據,牛逼的產品經理是如何為試驗想法排列優先級的?