閱讀525 返回首頁    go 阿裏雲 go 技術社區[雲棲]


自動駕駛中的計算機視覺技術——ICCV2015主題報告回顧

自動駕駛汽車過去隻出現在科幻作品中,而現在似乎已經離我們近在咫尺,這得益於近年來計算機視覺、機器學習等技術的高速發展以及計算機硬件處理能力的飛速提升。在這些新技術中,計算機視覺技術的進步對自動駕駛領域起到了極其重要的作用。今天,我們以回顧ICCV2015主題報告的形式為大家簡要介紹究竟有哪些計算機視覺技術應用到了自動駕駛領域。

2015年,在計算機視覺領域中的頂級會議ICCV中,組委會針對自動駕駛專題,邀請了來自戴姆勒、豐田、牛津大學、博世公司等世界頂級研究者做了主題報告。下麵為大家推薦這次主題報告的網站:https://sites.google.com/site/cvadtutorial15/materials
(其中包括了演講人的PPT,內容非常充實,有很多他們推薦的種子文章,感興趣的同學可以參考)

下麵簡要介紹一下這次主題報告的框架和大致內容,主要分為8個部分:
1) 自動駕駛領域的簡要介紹:
自動駕駛的需求,現在分為5個自動化程度等級的定義,簡要發展史。隨後提出了自動駕駛的基本問題,即:(1)車在哪?(2)車周圍有什麼?(3)下麵會發生什麼?(4)車該怎麼做?有了這些基本問題,計算機視覺能幫助我們解決什麼呢?比如:檢測路牌,和周圍的車輛展開互動,了解周圍發生了什麼等等。
image

2)雙目視覺在自動駕駛中的應用:
由於雙目視覺能夠獲得dense的三維信息,圖像可以獲得“語意”信息(理解圖像哪部分是什麼,比如:“公路”,“樹叢”等等),而且雙目視覺的準確性和魯棒性優秀,所以被使用在自動駕駛領域。隨後,主講人介紹了雙目視覺的原理,在自動駕駛領域中的發展曆程。之後,詳細介紹了所在的戴姆勒公司所用的一些技術,包括:(1)stixel對真實世界進行“語意”表達;(2)利用卡爾曼濾波進行汽車並線的方法;(3)基於深度學習的物體歸類方法; (4)基於CNN的交通燈檢測。最後,演講人列舉了一些目前的技術挑戰。
image

3)多傳感器融合在自動駕駛中的應用:
由於自動駕駛對可靠性的要求,而不同傳感器的優勢又各不相同,所以被用作不同功能。這些傳感器包括但不限於:定位係統(GPS, 慣導係統等),3D激光雷達,雷達和相機。演講者首先介紹了他們(豐田)整個環境感知係統的架構以及每個傳感器可能的用途,隨後著重介紹了基於視覺的跟蹤和傳統跟蹤方法的異同,以及如何進行數據融合的方法。
image

4)基於“語意”的環境理解:
首先介紹了幾組通過“語意”進行環境理解的數據集,然後按由低到高的順序,從像素級語意分類,到基於區域的分類,最後到利用深度學習的“語意”分類進行逐步深入的介紹。
image

5)機器人為環境自動建圖:
將建圖過程分為兩部分分別介紹:(1)相機相對姿態的確定;(2)全局相機姿態的優化。將第(1)部分又拆解為5步完成,即:特征點檢測->特征點匹配->特征點跟蹤->飛值檢測和剔除->利用有效數據的最優化求解。第(2)部分則介紹了相機姿態基於圖論的全局最優化方法,包括常見的閉環檢測等。
image

6)自動駕駛中的定位問題:
首先闡述了定位在自動駕駛中的重要性。然後順序介紹了基於標誌物(如:車道,信號燈等)的定位,傳感器融合進行定位,以及如何利用GPS進行粗初始化定位的方法。
image

7)相機與其他傳感器的時空信息融合:
首先介紹了相機內參的標定工具,然後介紹了相機外參的校正、多傳感器的時鍾同步、多傳感器間的空間校準以及利用特定傳感器pair進行特定功能的解決方案。最後,演講人介紹了其主題在汽車領域的應用。
image

8)NVIDIA深度學習平台
image

以上是對這次主題報告的粗略總結,水平有限,如有錯誤還望指正,謝謝~

最後更新:2017-10-27 18:03:42

  上一篇:go  阿裏雲代金券_阿裏雲幸運券_阿裏雲優惠券領取地址及使用方法
  下一篇:go  阿裏鄢誌傑博士:“達摩院”要做下一代顛覆性的人機交互