閱讀1002 返回首頁    go 阿裏雲 go 技術社區[雲棲]


機器視覺與卷積神經網絡

根據2016年嵌入式視覺聯盟進行的嵌入式視覺開發者調查2,77%的受訪者表示目前正在或計劃將要利用神經網絡來處理分類工作。卷積神經網絡並不是一個最近才出現的新概念。但是隨著機器視覺的發展,卷積神經網絡的應用也變得越來越重要了。

機器視覺卷積神經網絡.jpg

早在1968年,加拿大神經生物學家David Hubel與瑞典神經生理學家Torsten Wiesel針對貓科動物視覺皮層進行了合作研究。視覺皮層是大腦皮層中主要負責將視覺數據處理成可用信息的部分。因此他們的目標是尋求如何從大腦接受到眼睛所采集的視覺圖像信息(比如“我看到一個蘋果”)中,獲得目標對象有用信息方式的答案。這兩名研究人員給貓演示不同走向的光條,在這一過程中發現視覺皮層的不同細胞會根據光條的走向被激活並做出反應。他們同時還發現複雜的光線圖案,比如眼睛的形狀,能夠激活視覺皮層更深層部位的細胞。通過Hubel和Wiesel的努力,最終研發出一個能夠演繹細胞激活和轉發特定圖像信息過程的模型。這也為計算機輔助圖像分類建模奠定了基礎。

30年後,法國計算機科學家Yann LeCun再次為Hubel和Wiesel所取得的成就所激勵。他將視覺皮層功能的演繹疊加到一個演算中 -- 並從中成功創建出第一個卷積神經網絡應用。

但即便如此,卷積神經網絡在之後的很多年仍未能適用於實際操作和應用。其中最主要的原因是卷積神經網絡需要投入大量的計算能力。使用串行技術處理數據的CPU處理器需要對數據記錄挨個進行分析,意味著在這一網絡能夠最終應用於工作之前需要花費多年時間。

直到圖形處理器單元(GPU)的出現,能夠對數據實現並行處理,卷積神經網絡才再一次被人們記起 -- 實際上近年來卷積神經網絡的發展已經有了很大的起色。研究人員對卷積神經網絡在筆記識別、醫療診斷、自動駕駛車輛預警係統,機器人物體識別以及生物識別技術應用方麵取得的巨大成功感到欣慰。與其它競爭性學習技術相比,卷積神經網絡在具有挑戰性的應用中通常能夠產生更好的結果。包括Google、IBM、微軟和Facebook等大型企業所投資的數十億美元巨額資金無不表現出其對這一領域的極大興趣以及這一技術本身所具有的巨大潛力。

卷積神經網絡不僅需要密集的處理器運作;同樣對數據有極大需求。對卷積神經網絡進行一次徹底培訓,需要輸入大量已經分類的圖像數據。目前開發人員能夠自由訪問與此相關的數據庫。最常用的圖像數據庫之一是ImageNet1。 它包含超過1400萬幅分類圖像。同時還有一係列針對具體分類問題而存在的專門數據庫。比如,一個名為德國交通標誌識別基準的數據庫中就保存了5萬餘幅關於交通標誌的圖像。在這一例子中,卷積神經網絡在2012年測試中取得了高達99.46%的成功率 -- 超過人工分類取得的98.84%。然而,在實踐過程中,開發人員通常會麵臨高度專業化的分類問題,因此無法獲取自己的圖像數據庫。但幸運的是,現在他們並不需要采集數百萬張圖像。一項被稱為“遷移學習”的技術小竅門能夠大大減少所需的圖像數量,有時甚至隻需要幾百或幾千幅圖像。

目前已經開發出一係列適用於卷積神經網絡的深度學習框架:包括Caffe,Torch和Theano在內的眾多軟件庫都是專為這一課題而研發。2015年11月,Google甚至為此開放了內部機器學習軟件TensorFlow,這一軟件是從圖像搜索到Google Photo等多種Google產品的基本組成部分。

嵌入式相機(Baslerdart BCON)通過柔性帶狀線材與具有FPGA(XilinxZynq)的處理單元相連接。圖像數據的分類在FPGA上運行,因此可以進行實時計算。配置了FPGA的嵌入式視覺係統具備一係列能夠完美適用於卷積神經網絡的優點: FPGA能夠執行卷積操作和網絡所需的其它數學運算,以便對圖像進行並行和高速分類任務。此設置提供實時圖像分析和分類功能。

相比GPU,FPGA所需功耗更小,因此更適合低功耗的嵌入式係統。微軟研究院最近發布的一份報告8顯示,FPGA能夠比GPU節省10倍功耗。

FPGA的大型片上存儲和帶寬使卷積神經網絡能夠對更高分辨率的圖像進行實時分類。能夠與FPGA直接連接的相機(如Basler's dart BCON相機)能夠將數據直接傳送到FPGA。這是處理器密集型應用程序(如卷積神經網絡)的一個主要優勢,因為通過USB傳輸的數據在到達FPGA之前必須通過不同的硬件組件(比如主機控製器)運行。實現相機與FPGA的直接連接能夠保證更加高效的工作性能。

卷積神經網絡在機器視覺應用領域中發揮越來越大的作用。2015年3進行的同一項調查顯示,僅61%的受訪者有此打算。2016年進行的該項調查還發現,86%的卷積神經網絡被用於分類算法。這一結果表明,除了像Google或Facebook這樣擁有龐大規模和豐富資源的大公司之外,普通的公司也能夠自主研發基於卷積神經網絡的產品或服務。

本文由朗銳智科編輯整理(www.lrist.com),如有侵權請聯係本站。

最後更新:2017-09-07 11:32:24

  上一篇:go  工業控製計算機主板的布局與設計要點分析
  下一篇:go  機智雲開源BLE SDK,為智能硬件提供完備的藍牙兼容支持