閱讀134 返回首頁    go 技術社區[雲棲]


數據可視化難在哪裏?該如何入門

本文講的是數據可視化難在哪裏?該如何入門,文章從幾個方麵簡要分析了數據可視化,希望能夠幫助你對數據可視化有一個整體的認識。
數據可視化是指將數據以視覺的形式來呈現,如圖表或地圖,以幫助人們了解這些數據的意義。通過觀察數字、統計數據加以轉換獲得清晰的結論並不是一件容易的事。而人類大腦對視覺信息的處理優於對文本的處理,因此使用圖表、圖形和設計元素把數據進行可視化,可以幫你更容易的解釋數據模式、趨勢、統計規律和數據相關性,而這些內容在其他呈現方式下可能難以被發現。可視化可簡明地定義為:通過可視表達增強人們完成某些任務的效率。
image
任何形式的數據可視化都會由豐富的內容、引人注意的視覺效果、精細的製作三個要素組成,概括起來就是新穎而有趣、充實而高效、美感且悅目三個特征。
下麵分別從數據可視化的價值、什麼是好的可視化、數據可視化難在哪裏、可視化過程中的注意事項、單個圖表的構建過程幾個方麵聊聊數據可視化,最後推薦幾本經典圖書。
數據可視化的價值
數據可視化都有一個共同的目的,那就是準確而高效、精簡而全麵地傳遞信息和知識。可視化能將不可見的數據現象轉化為可見的圖形符號,能將錯綜複雜、看起來沒法解釋和關聯的數據,建立起聯係和關聯,發現規律和特征,獲得更有商業價值的洞見和價值。並且利用合適的圖表直截了當且清晰而直觀地表達出來,實現數據自我解釋、讓數據說話的目的。而人類右腦記憶圖像的速度比左腦記憶抽象的文字快100萬倍。因此,數據可視化能夠加深和強化受眾對於數據的理解和記憶。
圖形表現數據,實際上比傳統的統計分析法更加精確和有啟發性。我們可以借助可視化的圖表尋找數據規律、分析推理、預測未來趨勢。另外,利用可視化技術可以實時監控業務運行狀況,更加陽光透明,及時發現問題第一時間做出應對。例如天貓的雙11數據大屏實況直播,可視化大屏展示大數據平台的資源利用、任務成功率、實時數據量等。
好的數據可視化
數據可視化能做到簡單、充實、高效、兼具美感就是好的可視化:
簡單點說好的數據可視化和好的產品是一樣,都有友好的用戶體驗,不能讓人花了時間又看得一頭霧水,甚至被誤導得出錯誤的結論。準確 用最簡單的方式傳遞最準確的信息,節約人們思考的時間。 最簡單方式就是最合理的圖表,需要根據比較關係、數據維數、數據多少選擇。
充實一份數據分析報告或者解釋清楚一個問題,很少是單一一個的圖表能夠完成的,都需要多個指標或者同一指標的不同維度相互配合佐證分析結論。
高效成功的可視化,雖表麵簡單卻富含深意,可以讓觀察者一眼就能洞察事實並產生新的理解,管理者能夠沿著你規劃的可視化路徑能夠迅速地找到和發現決策之道。
美感除了準確、充實高效外,也需要美觀。 美觀分為兩個層次,第一層是整體協調美,沒有多餘元素,圖表中的坐標軸、形狀、線條、字體、標簽、標題排版等元素是經過合理安排的 ,UI設計中的四大原則(對比、重複、對齊、親密性) 同樣適用於圖表。 第二層才是讓人愉悅的視覺美,色彩應用恰到好處。把握好視覺元素中色彩的運用,使圖形變得更加生動、有趣,信息表達得更加準確和直觀。色彩可以幫助人們對信息進行深入分類、強調或淡化,生動而有趣的可視化作品的表現形式,常常給受眾帶來視覺效果上的享受。協調美是視覺美的基礎。
數據可視化難在哪裏
好的產品體驗不是一件容易的事情,是專業產品經理、UE、UI完美配合的產物,同樣做好數據可視化也不容易,需要具備一定的數據分析能力、熟練使用可視化工具、較好的美術素養、良好的用戶體驗感覺,還能夠換位到受眾角度審視自己的作品,光有理論遠遠不夠,還需要大量的實踐磨煉,把理論固化成自己的感覺。
數據不準確、結論不是很清晰,所以數據可視化的最大難點在數據可視化之外的基礎性工作,數據收集、數據分析沒有做好,可視化就是徒勞無功。
數據可視化是用高度抽象的圖表展示複雜的數據、信息,需要邏輯及其嚴密
維度多、變量多,不確定應該展示哪些信息 數據過多,需要采用交互式的展現可視化, 例如,可以充分利用地域的分級包含關係展示不同地域層次的圖表。
和UI圖形界麵相比,圖表隻有有限的文字、圖形指引,不能很好的說明數據的上下文關係。
圖表高度抽象,對於閱讀者素質要求很高,閱讀者也需要了解各類圖表所傳遞的對比關係、異同等基礎知識。
選擇正確的圖表不容易,各類圖表都有自己的優勢和局限性,光柱狀圖就有一般柱狀圖、分組柱狀圖、堆積柱狀圖、橫線柱狀圖、雙向柱狀圖等。
圖表細節處見真功夫,圖表需要考慮細節實在是太多,布局、元素、刻度、單位、圖例等等都需要合理。 細節處理不到位,影響可視化的效果,例如:折線太細不便於觀察線太粗又抹平了趨勢細節; 更嚴重問題可能誤導受眾, 例如:刻度選取不合理折線過於陡峭 。
可視化過程的注意事項
總結幾點注意事項,少走些彎路:
數據圖表主要作用是傳遞信息,不要用它們選技巧,不要追求過分漂亮
不要試圖在一張圖中表達所有的信息,不要讓圖表太沉重,適得其反
數據可視化是以業務邏輯為主線串聯,不要隨意堆砌圖表
避免過度開發,什麼數據都想展現,數據太多就選擇最核心的數據指標、和正常偏差大的、能支持分析結論的
不要試圖掩蓋問題,回避“不良結論”,真實反映業務,暴露問題
慎用動態圖表,尤其一個頁麵多個動態圖表
避免過度設計,一般不適用3D、陰影,合理運用色彩同樣能讓圖表顯示的很高級
數據產品的表現層可算作是大型的數據可視化項目,是產品設計方法和可視化方法的結合,分別掌握的產品設計方法和可視化方法然後綜合運用不是什麼難事,這裏隻說說單個圖表的構建過程,以此引申出後續《圖表可視化係列》文章
明確圖表想說明什麼業務問題、業務邏輯 、數據分析結論
確定關係和對比的維度,是時間趨勢、比較,還是分布關係,對比維度(時間: 同比 環比 定基)、空間(華南 華北 區域與全國)、特定標準(實際和計劃)
根據對比關係,數據維度,數據分類多少選擇合理的圖表,每一種圖表都有它自身的優點和局限性
生成圖表並驗證是否正確,是否和預期一致
細節調整,坐標軸(刻度標記類型、間隙、刻度標簽位置、數據類型、小數位、是否千分位)、顏色取值、圖例位置、圖上標簽、圖表標題等細節
在恰當處備注文字說明,例如標注特殊事件
最後推薦幾本數據可視化領域的經典圖書,有時候網上刷再多的文章不如好好閱讀一本書。
這兩本都是浙江大學計算機學院教授、可視化專家陳為老師的著作,知識全麵,非常體係化。從數據可視化的基礎理論到各種類型數據的可視化方法,再到如何實際應用,可以算是數據可視化的百科全書或者專業教材。兩本書內容基本一致,二選一即可,第一本是彩本,價格略貴。
作者根據數據可視化的一般順序,先後介紹了如何獲取數據,將數據格式化, 然後用可視化工具(如 R)生成圖表,最後在圖形處理軟件(如 Illustrator)中修改完善,使圖表達到最佳 的可視化效果。本書詳細介紹了柱形圖、餅圖、折線圖和散點圖等圖表的繪製方法及各自的優缺點,還用專門的一章介紹與地圖相關的數據可視化技巧。
在常見的Javascript圖表組件中,我最喜歡Google Chart,圖表類型豐富,接口規範全麵,能滿足很多個性化的需求。

作者:佚名
來源:51CTO
原文標題:數據可視化難在哪裏?該如何入門

最後更新:2017-09-20 17:32:38

  上一篇:go  會玩超級瑪麗,機器學習能有多難?
  下一篇:go  日誌係統之HBase日誌存儲設計優化