分享 Visualizing MBTA Data
Visualizing MBTA Data 作者:Mike Barry and Brian Card
原文鏈接: https://mbtaviz.github.io/
通過@數據挖掘與數據分析 轉發的 @英特爾商用頻道 的相關微博,看到了這個非常出彩的數據可視化分析報告。之所以稱之為報告,是因為其中詳盡的數據說明和清晰的分析層次,已經不能簡單地說是一個數據可視化展示了。
交通數據一直是數據可視化的一個熱點,Visualizing MBTA Data(VMD)這個作品也將視角鎖定在了這個領域,並選取了地鐵運行數據來進行數據可視化分析。先介紹一下背景。美國波士頓的馬薩諸塞灣交通局掌管著繁忙度全美排名第四的地鐵係統。最近馬薩諸塞灣交通局將其大量的地鐵運營相關數據通過API的形式向公眾開放。該API提供的數據良好的遵守了GTFS(一種由GOOGLE製訂的常用於交通運輸數據的數據格式)規範。
該作品的兩位作者正是基於馬薩諸塞灣交通局提供的良好數據源,從中提取了2014年2月整月四條地鐵主幹道的地鐵的行駛數據,同時又通過MBTA獲得了各個地鐵站檢票閘的人流量數據。在此基礎上,作者認為可以從三個層麵來展現數據:地鐵的行駛,人們如何搭車地鐵,地鐵和乘客兩者從數據上反映出的相互關聯。
可以看到在擁有良好數據源的基礎上,作者在提出問題的過程中,完全沒有試圖去提出解決地鐵運營或者改善地鐵運營的設想,隻是希望更好地展現數據本身。首先作者的前兩個問題就將數據源維持在簡單的單維度信息源上,沒有基於設想兩者的融合展示。然後也是希望通過將兩個單維數據通過可視化的形式充分展示理解後,再找數據連接點。這無論是從作者自身分析問題,還是閱讀者來看這個作品都是一個非常好的分析理解過程。這種前期問題的設定也是非常值得學習的,現在更多人總是在拿到一份數據後總在想通過數據可視化最終找到一個什麼問題的症結所在從而解決一個問題,卻恰恰跳過了最最重要的看清數據長什麼樣的過程。
具體對於問題一步步的分析文章裏就不詳述了,因為原文已經有了非常細致說明,在這兒就說說我自己從這個作品中學到的幾點。
- 優秀的聯動
現在,我們在製作數據可視化作品的時候已經非常注意圖表間的聯動了。最早在袁曉茹老師的課上了解做LinkView的優點,現在ECharts更加是做了很好地聯動配置。但是在這個可視化作品裏,我看到了自己一直忽視的說明文字與圖表的聯動。例如下圖:
點擊左邊的時間段說明文字,右側圖表的時間軸會自動滾動到對應的時間段。如果說這個聯動還太像圖例,圖中右側的說明名字中的藍色文字將會高亮需要注意的異常數據,這就是非常典型的文字說明與圖表的聯動。這樣的聯動在這種明細展示類型中特別好用,可以幫助用戶快速進入分析過程,這種的分析結果輸出不顯得突兀,有別於單純信息圖表的信息輸出。
- 自身圖表的完善
說實話剛看到作品中第一個地跌行駛數據的可視化行駛,心中咯噔了一下,這種大規模數據的展示如果在頁麵中出現分頁的情況,非常不利於可視化的解讀。雖然良好的交互以及明白了作者所要體現的問題,讓我體驗的感覺好了不少,但還是覺得有更好地形式來展示這份數據。作者仿佛準備抓住了我的這種心裏,在這個段落的最後給了我驚喜。
這張圖其實相當於上圖的壓縮版,在非常小的空間裏簡潔明了的展示了總體數據的形態,也非常容易捕獲異常數據的所在。同時在這一個可視化上麵的說明文字中也與這幅圖有聯動,真是讓人充分感受了良好的數據閱讀體驗。
- 清晰層次
作者在用數據可視化展現數據的同時,也通過良好的分析層次結構展現出來。無論將總的問題拆成三個層次鮮明的三大部分,還是數據可視化方法從前到後由簡到繁、從分到總得設計,都讓讀者仿佛跟著兩位作者一同完成了這個作品,所以說這篇文章本身也是對於兩位作者分析過程的一種可視化展示。
這個作品讓我有點小激動,一口氣寫下了這篇文章,其中有什麼錯誤的地方請大家指出。這篇文章我也放到了我們的數據可視化社區datavlab.org上,同時也歡迎大家在新浪微博上關注@DataV,繼續和我討論。謝謝大家!
最後更新:2017-04-01 13:38:49