閱讀714 返回首頁    go 阿裏雲 go 技術社區[雲棲]


體係結構頂會 ASPLOS 2017 最佳論文出爐,阿裏雲周靖人主旨演講

  ASPLOS(編程語言和操作係統的體係結構支持會議)是ACM開辦的一個以體係結構為核心內容的多學科會議,其研究領域跨越硬件、體係結構、編譯器、編程語言、操作係統、網絡和應用,尤其關注這些學科間的交叉性研究課題。

  e06e4dbdb90c4a25ac0827a149cf0e85_th.jpeg

  大會上的研究可能針對不同的目標,如性能、能耗和熱效率(thermal efficiency),彈性(resiliency),安全性和可持續性。隨著登納德縮放定律(Dennard scaling)的結束,大數據的爆炸性增長,規模從超低功耗可穿戴設備到百萬兆級的並行計算和雲計算,對可持續發展的需求以及越來越多的以人為中心的應用,這種跨部門研究的重要性不斷增長 。

  2017 ASPLOS 在中國西安舉辦,中國科學院計算技術研究所研究員陳雲霽擔任大會主席。

  4d3fc63d75a74992ab2a3d2eff0414fe_th.jpeg

  本次大會收到320篇論文投稿,被接收論文56篇,這已經是接收數量最高的一年,去年是53篇,前年隻有48篇。

  本年度的ASPLOS共評出兩篇最佳論文:

  963aab05f0454379a2980609e68458f3_th.jpeg

  第一篇:《NUMA 架構的黑箱並發數據結構》(Black-box Concurrent Data Structures for NUMA Architectures)

  0a24775abba7437cb4aed75e549cb650.png

  高性能服務器是非均勻內存訪問(NUMA)機器。為了充分利用這些機器,程序員需要有支持 NUMA 性能工件的高效的並發(concurrent)數據結構。我們提出了節點複製方法(Node Replication,NR),這是一種用於獲取這種數據結構的黑箱方法。NR 采用任意的序列數據結構,並自動將其轉換為滿足線性化、支持 NUMA 的並發數據結構。使用 NR 不需要具備並行數據結構設計方麵的專業知識,因此不會產生並發上的錯誤。NR 從兩個學科中吸取了靈感:共享內存算法和分布式係統。簡而言之,NR 實現了一個支持 NUMA 的共享日誌,然後使用日誌在 NUMA 的各個節點間複製統一的數據結構。NR 最適用於競爭的(contended)數據結構,處理這種數據時性能可以超出無鎖(lock-free)算法 3.1 倍,超出鎖定解決方案(lock-based solutions)30 倍。為了展示在實際應用程序中使用 NR 的好處,我們將 NR 應用於內存存儲係統 Redis 數據結構。結果 NR 相比其他方法最高達到了 14 倍。NR 的成本是日誌和副本需要的額外內存。

  92a786e5dd464d7a937dc00023834e01_th.jpeg

  第二篇: Determining Application-specific Peak Power and Energy Requirements for Ultra-low Power Processors

  57cb1899c423462d8dd07056800a589e.jpeg

  許多新興的應用,如IoT,可穿戴式應用,可植入物和傳感器網絡都受到電力和能源約束。這些應用依賴於超低功耗處理器。當下,超低功耗處理器已經迅速成為生產得最多的處理器類型。在這些應用所使用的超低功耗嵌入式係統中,峰值功率和能量要求是確定係統關鍵特性的主要因素,如尺寸,重量,成本和壽命。

  雖然這些係統的功率和能源需求往往是特定於應用的,但傳統的峰值功率和能量評估技術無法準確地限製在處理器上運行的應用程序的功率和能量需求,從而導致過度配置,進而增加係統體積和重量。

  在本文中,我們提出了一種自動化技術,可在嵌入式係統中執行應用程序和超低功耗處理器的硬件 - 軟件協同分析,以確定針對應用的峰值功率和能量要求。與傳統技術相比,我們的技術提供比傳統技術更準確,更緊密的界限(bounds),用於確定峰值功率和能量需求,相比傳統的基於分析和保護帶(profiling and guardbanding)的方法,平均報告峰值功率降低15%,峰值能量降低17%。與一種基於激進壓力標記( aggressive stressmark-based)的方法相比,我們的技術報告的功率和能量平均分別下降了26%和26%。此外,與傳統方法不同,我們的技術報告了與應用程序輸入集無關的峰值功率和能量的保證範圍。可以利用峰值功率和能量的更緊密的界限來減小係統的體積,重量和成本。

  本屆大會的最有影響力論文,歸屬於發表於2002年的《Automatically characterizing large scale program behavior》。

  4fac5d1065ec4464823d981d506fc3ca.png

  下載地址:https://cseweb.ucsd.edu/~calder/papers/ASPLOS-02-SimPoint.pdf

  b83dd72ad7254b9a90472bf1c587122a_th.jpeg

  另外,SIGMOBILE的 Test of time Award 一般隻頒給 SIGMOBILE 旗下的會議論文,今年頒給了 ASPLOS 2002 發表的《Energy-Efficient Computing for Wildlife Tracking:Designing Tradeoffs and Early Experiences with ZabraNet》。

  e45dc029400d4a76ad383df87af21e51_th.jpeg

  中科院計算所研究員包雲崗在微信朋友圈介紹說,經過10年以上時間考驗的“Test-of-Time Award”頒給了 2002 年發表的 SimPoint;普林斯頓大學在 2002 年的 ASPLOS 文章神奇地獲得了 ACM SIGMOBILE 的 2017 年度“Test-of-Time Award”,這篇文章開創了使用無線傳感網跟蹤野生動物的新應用模式,迄今引用已超過 3000 次。

  bb8308ef54054b3bb9f20c38c817d51a.jpeg

  https://www.princeton.edu/~mrm/asplos-x_annot.pdf

  大會主旨演講部分,阿裏巴巴副總裁、阿裏雲首席科學家周靖人用英語發表演講,分享了阿裏雲的技術細節。以下是新智元根據速記的整理。

  5fcfad6596514fbe8530917ae072de07_th.jpeg

  作為中國最大的雲服務提供商,阿裏巴巴雲已經成為世界上增長最快的雲計算平台之一。在這次演講中,周靖人介紹了阿裏巴巴雲的大數據和 AI 計算平台,以及其中廣泛的產品和服務,這些都讓阿裏能夠實現快速高效的大數據開發和智能分析技術。還有底層計算基礎設施,它們支持各種計算方案,包括批量,交互式,流計算和圖計算,以及異構雲規模數據中心的大規模機器學習。周靖人還介紹了幾個大數據產品,如基於規則的引擎,推薦係統,BI工具等。阿裏雲平台不僅支持阿裏巴巴的內部業務,還為企業客戶提供的服務。

  956b1bac8904432f8754bfeaa005d0d9_th.jpeg

  周靖人在演講中首先介紹了阿裏雲規模的計算基礎架構,在底層,阿裏雲擁有數萬台機器以及大量的數據中心,分布在全國乃至世界各地。這一架構的頂層是各種資源管理係統,它們對資源進行管理和調度,支持廣泛的計算環境。

  各大公司的計算架構都很類似,但是阿裏雲的特色在於架構間各種資源是共享的,並且,由於是自建係統(home built system),係統在調度和部署時也會便利很多。

  0065a0d8bf444c138689329c8af1c852_th.jpeg

  阿裏雲的數據質量監測係統

  周靖人介紹說,當數據進入時,通常很“髒”,必須對數據集進行把控,所以阿裏雲有一個非常複雜的數據質量監控工具來監控數據生命周期,以及這一周期數據的質量。

  “當你改變數據和數據屬性,研究它的變化並進行規模化時,會引入一些異常,所以這一工具允許人們定義什麼是正確的數據屬性。”周靖人說。

  阿裏還有一個係統在後台連續監控數據集,這樣就可以保證數據集是正常分配的。當後台通知數據時具有一定的規模,在係統中可能有一種學習類型的閾值,會把消息通知到數據所有者。這樣就會得到一個非常緊密的封閉式監控係統,可以盡快捕獲任何種類的異常行為。

  c2101feeb09e4a188955a7fa91971a4d_th.jpeg

  計算模型圖

  9dc198524c6842e3b930bdadc3918a8a_th.jpeg

  阿裏雲機器學習平台 PAI

  阿裏雲機器學習平台是一個大型機器學習平台。它首先是一個雲計算平台,所有的訓練,一切都可以在雲中完成。 除此之外,這個平台還提供了圖形界麵(graphic interface),讓人們能夠將大數據分析與機器學習無縫整合。而在經曆了一係列的分析以後,就會生成模型,這就是離線的訓練階段。在訓練完成後,還必須做推理,服務模型,並且要學習,接受請求,並使用模型來開發,推斷數據。

  4032c491d13744b0a3ae93d308c33d9c_th.jpeg

  研究挑戰

  周靖人最後談了 ASPLOS 研究社區麵臨的一些研究挑戰,其中一個是對大數據分析有很大的需求。他以阿裏數據中心支持實際業務為例,講了數據中心必須支持廣泛的計算場景,不能隻將一個硬件分配到一個計算場景,必須考慮到這個硬件同時也會應用的其他計算場景。當時,為了需求,他們必須以 streamline 的方式將一種計算機轉變(transform)為另一種計算機,隨後自然就要需要應對異構硬件的問題。周靖人說,現在,阿裏可以說是有了很多機器學習硬件,還有一些專用的處理器。

  另一個挑戰是算法是不斷變化的。如果針對某個問題開發了一個特定的芯片或解決方案,解決方案和算法會隨著時間的推移而改變,這樣就會開發出很多特定的芯片和解決方案,然後就必須應對新的指令集,並在這麼多不同的芯片上創造生態係統。

  周靖人說,這些都是非常有趣的挑戰,並號召研究人員多多交流學習。他說,事實上,做研究係統的人應該更多地從新人那裏學習,融入研究社區可以發現自己想以怎樣的方式參與硬件設計,參與為某種計算場景做架構支持的項目當中。

https://it.sohu.com/20170413/n488171048.shtml

最後更新:2017-04-13 20:30:37

  上一篇:go HR,你姐姐喊你去看看是如何進行招聘的?
  下一篇:go 日誌服務客戶端(logtail)異常檢測工具