閱讀669 返回首頁    go 阿裏雲 go 技術社區[雲棲]


前沿 | 國際可視化盛會PacificVis2017的十個精彩案例


0?wx_fmt=jpeg
1. 可視分析中的新方向

馬匡六教授,美國加利福尼亞大學戴維斯分校


0?wx_fmt=png

與PPPL科學家合作進行等離子體湍流的計算機模擬


馬教授是國際可視化與可視分析研究領域的著名學術帶頭人之一,作為本次大會中Pacific VAST研討會的第一位演講嘉賓,主要從極大規模(Extreme Scale)數據的數據分析、事件序列數據分析這兩個方麵介紹了可視分析的研究新動向。第一個部分主要關注超大規模模擬所產生數據的可視分析,馬教授指出使用原位可視化(In Situ Visualization)是大勢所趨,應用場景包括科學可視化、在線數據或流數據可視化等等。其中,數據聚集操作是一類重要的方法。通過對粒子或者場數據進行概率分布函數(Probability Distribution Functions)計算並離散化為一維或二維直方圖,模擬數據的信息能夠得到很大程度的保留,並且能支持縮放、修改劃分、修改直方圖槽數量、以及利用直方圖進行查詢和選擇等多種操作;把二維直方圖按時間順序堆疊起來還可生成3D體可視化進行時變屬性分析。


第二部分主要介紹了事件序列數據可視化的幾個案例,包括高性能計算中的性能、日誌數據的可視化,如使用Behavioral Lines的雲計算性能的可視分析,以及醫院燒傷病人日誌數據的可視分析等等。馬教授還簡短地提到一個新的研究方向是保留隱私的可視化,具體可參考論文Privacy Preserving Visualization for Social Network Data with Ontology Information。


2. 城市數據的可視分析

巫英才教授,浙江大學


0?wx_fmt=png

SmartAdP係統界麵


巫英才教授首先介紹了城市數據分析麵臨的挑戰,主要存在三個方麵:(1)如何視覺提煉海量數據;(2)如何將專家知識融入分析中並獲得見解;(3)如何將挖掘的知識有效的傳遞給用戶。基於這些挑戰,可視分析是非常重要的。相應地,巫教授設立了多層次可視化、富交互多角度探索,以及通過故事敘事的形式表現分析結果這三個可視分析目標。


隨後他介紹了在城市可視分析方麵的兩個工作:SmartAdP 是一個利用出租車軌跡數據,綜合車流量(車流量越大,越可能看到),車速(越慢越好),OD區域(潛在用戶的途徑路線),環境等多個因素,自動產生廣告牌的擺放的解決方案,並提供可視分析界麵支持用戶進行探索和決策的工具,具體介紹可參考同名論文或北大的博文:用海量出租車軌跡數據選取廣告牌放置位置;Route-Zooming 則是一種通過道路變形將道路信息嵌入到地圖中的技術,實現盡可能少變形的前提下,對地圖上的道路進行拓寬,然後將時空數據圖表內嵌入道路中。


3. 眼動追蹤與可視分析
Daniel Weiskopf,德國斯圖加特大學


0?wx_fmt=png

幾種不同的眼動軌跡圖


近年來,硬件技術的進步和眼動追蹤裝置成本的降低使得這種分析技術可以被大量的研究人員使用。Weiskopf 教授一方麵指出了眼動追蹤技術在用戶研究中的作用,即幫助研究用戶是如何使用可視分析界麵的。與傳統的計算準確度和問卷調查等形式不同,該技術能有效捕捉用戶注意力的分布情況。另一方麵,則介紹了如何通過可視分析技術來輔助對(大量)眼動追蹤數據的解讀。其中,常用的兩種分析方法包括Space-time cube軌跡顯示法以及Map display軌跡顯示法;而針對不同類型的眼動追蹤數據,如關注區(AOI)、瀏覽軌跡(Scan Path)和聚焦點(Fixation)等,Weiskopf 教授也分別介紹了其分析方法。更多詳情請參考其論文:Visual Analytics Methodology for Eye Movement Studies。


最後,Weiskopf 教授總結道,以上兩種眼動追蹤可視分析結合起來,可以稱作是一種“Vis4Vis”方法——即“用於分析可視化作品的可視化(Visualization for visualization)”。這種可視化類別目前未得到明確定義和劃分,因此他希望學術界能夠更多地關注該方向的研究。


4. 用可視化進行數據敘事

Bongshin Lee,微軟


0?wx_fmt=jpeg

SketchStory工具:用自由手繪講述更吸引人的數據故事


來自微軟研究所的Bongshin Lee博士由漢斯·羅斯林教授經典的全球人口變化介紹等可視化案例引入,介紹了她在故事敘事(storytelling)方麵自2012年以來的理論研究。在她的文章More than telling a story中,給出了對視覺數據故事(visual data story)的定義,概括出三大要素:數據驅動、視覺展示,以及故事片段之間的邏輯關係;而故事敘事的過程則由探索數據,製造故事,和敘述故事這三個階段有機地組成。


另一方麵,Lee博士具體介紹了其團隊開發的,幾款幫助故事敘事的創作工具:SketchStory 受白板動畫(Whiteboard Animation)展示方式的啟發,提出一種使用觸控筆在電子板上描繪圖表的故事敘述方式,幫助提升聽眾的參與感;DataClips 是為非專業人士設計的數據視頻創作工具,通過對紐約時報等74個數據新聞視頻進行分析,建立數據新聞材料庫,相比傳統視頻製作軟件更易於上手,且能更靈活地修改數據;Timeline Storyteller 是使用時間線為順序的敘事工具,利用了對200餘款同類可視化的總結及從中提取的設計模式,可以在線嚐試。最後展望了未來的storytelling方向和挑戰:包括如何融合故事的探索到展現的過程;如何評估數據驅動的故事和工具;數據故事的可讀性;新穎的、浸入式的交互體驗在storytelling的應用。


5. 虛擬牽引器(Virtual Retractor)

Cheng Li,俄亥俄州立大學


0?wx_fmt=png

Virtual Retractor:使用基於物理變形的交互式數據探索係統


來自俄亥俄州立大學的可視化小組提出了Virtual Retractor這種創新的交互式數據探索係統, 在保證數據特征的基礎上對於可視化進行變形,從而解決科學可視化的3D空間中存在著遮擋的問題。該係統采用Retractor的隱喻,允許用戶像切割和分割實際物體一樣,直接操縱和探索數據。這個過程通過使帶有空隙的四麵體網格(tetrahedral mesh)變形來模擬由切割產生的切口來進行。分割操作擴大了空隙,允許用戶觀察原來被遮擋的內部結構。其中,網格(mesh)的構造考慮了局部數據屬性,如局部數據密度或梯度。因此,變形將受到所選數據屬性的影響。具有高數據屬性值的區域更加堅固,難以變形,而屬性值較低的區域將會變形。從而,變形可以保持數據中被感興趣的特征。


6. 可視分析改變世界

David Ebert,美國普渡大學


0?wx_fmt=png

用於多個聚合尺度的微博數據分析的可視分析框架


David Ebert教授是可視分析領域的專家,在包括安全、國防、社交媒體等等領域都有相關的可視分析工作。本次演講中,他首先總結了我們目前麵臨的解全球性難題,如能源、可持續發展、潔淨水、人口資源等問題,並鼓勵學者進行基於應用驅動的研究(Application-driven research),這樣能有效推動科學發現和改善世界,而且也有助於獲得研究資金和更多優質合作機遇。


在對可視分析進行釋義之後,他介紹了人機合作設計Human Computer Collaborated Design (HCCD),這種可以結合人類與計算機各自的優勢、方便溝通,並有效地實現問題決策的方法;並舉了一係列關於利用社交媒體、安全、資源分布等等方麵的例子(可參見他早前的報告)。他強調,可視分析是輔助人、提升人的能力,而不是替代人的工作。最後,他還對最近興起的深度學習、風險可視分析(Risk Visual Analytics)、因果可視分析(Causality Visual Analytics)以及VR/VA結合可視化等熱點話題進行了討論;並表示他對VR/VA在科學發現和決策分析領域的作用持觀望態度,但基於人們對這類技術的熱衷程度,他亦對此抱有期待。


7. 圖可視化的新評估方法

Seok-Hee Hong,悉尼大學


0?wx_fmt=png

Hong教授及其合作者提出的圖可視化模型


圖可視化主題在今年所接受論文、海報張貼中都有著很大的比例,而Hong教授在演講中介紹的忠實性(Faithfulness)指標在此次大會中多次被其他演講者引用,可謂熱中之熱。現有的圖布局評估方法,如基於邊交叉的方法,主要關注圖的可讀性;但隨著大數據時代的來臨,原有的評估方法是不夠的,因為包含大量數據的圖通常過於複雜,導致用戶難以直接通過感知邊的交叉來評估圖布局的優劣。


於是,他們針對大圖提出了忠實性(Faithfulness)指標,它包括三大部分,Information faithfulness (圖布局對信息表現的忠實性), Task faithfulness (圖布局對任務的支持度)和Change faithfulness(圖布局對數據微變化的敏感度);同時提出了基於形狀的度量方法(Shape-based Metric)來計算Task faithfulness,且通過實驗證明了這種方法的有效性。有關對力導向圖和邊捆綁技術等現有可視化方法的忠實性(Faithfulness)評估,以及忠實性與可讀性的比較,請參考其論文:Towards Faithful Graph Visualizations。


8. Interaction+:“讓可視化動起來”

陸旻,北京大學


0?wx_fmt=png

Interaction+ 基本交互界麵


這個富有創意的工具早在2016年ChinaVis作為海報展出時就十分吸引人眼球,無需編程就能將網絡上現有的可視化作品變成動態可交互的,這對可視化設計師甚至工程師都是提高工作效率的福音。如今,這個工具不僅能自動識別已有的網頁可視化作品中的視覺圖元及屬性信息,然後對原可視化內容進行過濾、聚集和重排,還能讓用戶能在原可視化的基礎上用輔助麵板進行查詢、比較、打標簽等交互。


其實現原理是通過解析網頁HTML文件物件模型 (DOM),並對SVG元素進行提取和操作,因此該工具適用於任何網頁上的SVG可視化作品,可以是程序員編寫的程序也可以是藝術家製作的信息圖。作者以紐約時報上的幾個可視化作品為例,對工具進行了精彩的演示,視頻詳見北大公眾號相關文章:“讓可視化動起來”的網頁交互工具Interaction+。


9. 基於Spark的大規模高維數據可視化

Jaemin Jo,首爾國立大學


0?wx_fmt=png

SwiftTuna中的大規模並行處理流程


來自首爾國立大學的Jaemin Jo首先分析了針對大規模數據的交互式探索的相關研究(見附錄)。常見的方法是使用數據立方體(data cube)等預處理數據結構,來總結數據並提供低延遲響應。然而,由於查詢中涉及很多維度,這種方案會占用大量的內存,且在查詢前必須由數據構建特定數據結構。他所在的團隊則利用亞馬遜EC2集群,並且基於Spark的流式處理方式,開發了適用於大規模高維數據可視分析的係統SwiftTuna。為了支持響應查詢,SwiftTuna利用增量處理方法,立即提供低保真響應(即快速響應)以及延遲的高保真響應(即增量響應)。該係統支持對高達含有40億條記錄和40個維度的真實數據集的實時探索,且增量響應的延時僅為幾秒鍾。具體實現詳見論文:SwiftTuna: Responsive and Incremental Visual Exploration of Large-scale Multidimensional Data。


10. 增強現實(AR)可視化

Gerard Jounghyun Kim,韓國高麗大學


0?wx_fmt=jpeg

Kim教授總結的AR中的可視效果問題


隨著AR技術的興起,AR與可視化的結合也成為了可視化領域的新熱點。Gerard Jounghyun Kim教授主要從AR領域研究者的角度,分享了他對AR可視化的看法。Kim教授認為AR可以被視為一種特殊的數據可視化,其數據不僅有現實數據,還包括了增強物數據;由於AR的特殊屬性,在實現有效的可視化時會麵臨一些獨特的問題,對此Kim教授總結和提出了AR可視化的三個主要要求,即(1)自然度 - Naturalness,(2)可見度 - Visibility,(3)持久性/穩定性 - persistance/stability。


自然度指的是增強物需要與用戶對真實世界的認知模型保持一致,如正確的深度信息、相似的光照效果、合理的空間關係等等。可見度是指最大化信息的可見度,例如增強目標物體的顯示、利用過濾法消除信息遮擋、平衡真實環境和增強物的關係等等。持久性和穩定性是指增強物應保持穩定,且易於查看與交互。Kim教授以鋼琴樂譜增強現實可視化為例,指出用戶在演奏的時候同時關注鍵盤與樂譜,需要經常轉移視線,容易造成疲倦。


最後,Kim教授談論了AR可視化中一些待解決的問題以及相應的發展方向,包括增強物的放置(如去除遮擋、決定尺寸位置)、三類要求衡量標準的製定,以及平衡增強物的自然性和可見性等等。


後記


以上內容是對筆者在參加會議期間個人比較感興趣,或是比較新穎的一些主題的整理,限於篇幅還有很多精彩的演講沒有列舉,如果感興趣可以參考完整的會議項目。更多詳情也可參考北京大學可視分析公眾號的係列文章(詳見附錄:參考文獻),本文中一些對專有名詞及技術描述的翻譯參考了該係列文章,特此聲明和感謝。


由於會議內容均以英文呈現,且有許多筆者不太熟悉的領域和名詞,盡管筆者在寫作過程中參考了大量資料,仍可能存在疏漏或不準確的地方,請多包涵,也歡迎批評指正。謝謝!


附贈實用鏈接


數據敘事實例及工具:

  • 機器學習的視覺化介紹 | Kantar信息之美2015年獲獎作品,以懂得區別舊金山和紐約市房屋的模型為例,在網頁中將機器學習的基本過程一步步地用動態圖展現,有(繁體)中文版。(https://www.informationisbeautifulawards.com/showcase/743-a-visual-introduction-to-machine-learning)

  • 統計的樂趣 | 漢斯·羅斯林 (Hans Rosling) 最出名的一次演講,在 4 分鍾內,用 12 萬個數據解釋 200 個國家 200 年的發展,有中英字幕。(https://v.youku.com/v_show/id_XNTM0ODg3ODg4.html?from=s1.8-1-1.2&spm;=a2h0k.8191407.0.0)

  • 新興的故事敘事技術 | 頗值得一讀的綜述性英文論文,題目為 Emerging and Recurring Data-Driven Storytelling Techniques: Analysis of a Curated Collection of Recent Stories.(https://www.microsoft.com/en-us/research/wp-content/uploads/2016/04/MSR-TR-2016-14-Storytelling-Techniques.pdf)

  • SketchInsight 和 SketchStory | 這個視頻展現了數據敘事中,兩種白板動畫型創作工具的結合使用:前者用於創作故事,後者用於展示故事。(https://www.microsoft.com/en-us/research/video/sketchinsight-telling-stories-with-data-via-freeform-sketching/)

  • 以周計算的你的一生 (互動版), 阿拉伯之春時間線 | 兩個時間線可視化的實例,分別采用了分段布局和曲線布局。(https://www.huffingtonpost.com/wait-but-why/your-life-in-weeks_b_5366289.html,https://labs.coruscantconsulting.co.uk/life/weeks/,https://www.slow-journalism.com/sj-site/wp-content/uploads/2012/03/Arab-Spring-timeline.jpg)


0?wx_fmt=png

以周計算的你的一生.png


0?wx_fmt=png

Timeline Storyteller 使用實例


  • 時間線的重新審視 | 總結了263種時間線數據可視化,提出了有效進行時間線敘事的設計空間,包括來自表達,規模和布局這三個類別的14種設計方案,以及方案的20種組合方式。(https://timelinesrevisited.github.io/)


大規模高維數據可視化:

  • imMens (2013) | 來自斯坦福大學,針對大規模數據的實時可視化探索工具。開源[Github],具體實現參見論文[PDF]。(https://vis.stanford.edu/papers/immens,https://github.com/uwdata/imMens,https://sfu-db.github.io/cmpt884-fall16/Papers/immens.pdf)

  • Nanocubes (2013) | 一個獲獎眾多,基於數據立方體(data cube),支持多維度、多粒度時空數據的實時聚合分析工具。開源[Github],提供API,具體實現參見論文[PDF]或北大相關博文。(https://nanocubes.net/,https://github.com/laurolins/nanocube,https://github.com/laurolins/nanocube/blob/master/API.md,https://nanocubes.net/assets/pdf/nanocubes_paper.pdf,https://vis.pku.edu.cn/blog/nanocubes-%E5%AF%B9%E6%97%B6%E7%A9%BA%E6%95%B0%E6%8D%AE%E7%9A%84%E4%BA%8B%E5%AE%9E%E6%8E%A2%E7%B4%A2-nanocubes-for-real-time-exploration-of-spatiotemporal-datasets/)

  • Hashedcubes (2016) | 提出了比現有大規模數據實時視覺探索技術更高效、簡單的方法,開源[Github],左側鏈接為論文PDF。(https://hdc.cs.arizona.edu/papers/infovis_2016_hashedcubes.pdf,https://github.com/cicerolp/hashedcubes)

  • Gaussian Cubes (2016) | 跟Hashedcubes一樣是來自亞利桑那大學的成果,在現有技術的基礎上增加了最小二乘法和主成分分析等模型的支持,左側鏈接為論文PDF。(https://hdc.cs.arizona.edu/papers/infovis_2016_gaussian.pdf)


原位可視化(In Situ Visualization):

  • 大規模數據可視化 | 來自北京大學可視化與可視分析博客的主題介紹文章。(https://vis.pku.edu.cn/blog/%E5%A4%A7%E8%A7%84%E6%A8%A1%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96-large-scale-data-visualization/)

  • 高性能計算與原位可視化 | 李思昆教授於2016年中國可視化大會上,對原位可視化(In Situ Visualization)技術及國內高性能計算研究現狀的介紹。(https://chinavis.org/2016/chengdu_summit/ChinaVis_Summit_Chengdu_20160605_SikunLi.pdf)

原文發布時間為:2014-04-29

本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號

最後更新:2017-05-17 10:01:54

  上一篇:go  使用ruby解析json
  下一篇:go  《人民的名義》如何圈粉“90後”| 大數據輿情分析