閱讀263 返回首頁    go 阿裏雲 go 技術社區[雲棲]


演講實錄丨山世光 閑話AI時代的視覺智能

小編按

10月22日,來自國內外人工智能專家及行業領袖齊聚世界機器人大會,在其專題論壇2016中國智能機器人產業高峰論壇上展開一場別開生麵的機器人和人工智能主題演講,並帶來精彩互動交流。

了解到還有很多粉絲不能到場參會,小編特地整理了參會嘉賓中科視拓董事長、計算機視覺專家山世光報告速記,讓大家一睹為快~


本文根據速記進行整理


閑話AI時代的視覺智能

山世光

中科視拓董事長、計算機視覺專家


山世光:非常高興今天有機會到這樣一個論壇上來分享一下關於在人工智能時代的計算機視覺發展情況。今天我們這個論壇一個青年論壇,所以應該是幾位講者比較年輕。首先,其實為什麼叫閑話,組織這個論壇過程當中我們討論這個論壇的主要聽眾誰?包括達到什麼效果?我說之前講的偏技術一點,這次希望能夠比較閑談一點,關於人工智能這樣一個話題。


a13ab129b2695d1f10977b53522ae63505fec672a13ab129b2695d1f10977b53522ae63505fec672a13ab129b2695d1f10977b53522ae63505fec672a13ab129b2695d1f10977b53522ae63505fec672


    可能大家非常切身感受到人工智能在過去兩三年時間裏麵,成為一個非常熱的話題。我們稱之為人工智能AI熱潮。大家知道人工智能熱潮不是第一次,也許也不是最後一次。因為在上個世紀60年代和80年代分別曾經有過人工智能的熱潮,但是之後很快相繼出現AI寒冬這樣一個概念。這次人工智能熱潮和前兩次人工智能熱潮有什麼不同?前兩次AI熱潮其實因為不能夠兌現承諾進入寒冬,前兩次人工智能進入熱潮的時候,人工智能科學家他們給出一些預測和承諾,這些沒有達到一個目標,所以進入寒冬。


    而這次跟過去不同,主要體現在這次熱潮不是基於承諾,而是基於進步。這個進步有哪些方法?舉個例子,一個大家非常熟悉的阿爾法G在今年比賽上打敗了(李世石音譯),在人工智能研究人員來看跨越式發展,之前可能說人工智能打敗人可能還需要10年或者更久時間,可是這個時間很快出現了。


    在計算機視覺而言,在過去兩三年時間裏麵,計算機視覺來主導的或者是作為輔助這種汽車輔助駕駛係統走入我們生活。(特斯拉音譯)輔助兩者結合進入輔助駕駛功能,這些功能準確估計和前車的距離,包括前車的速度,以及車道線的偏離,做預警提醒駕駛員的功能。其實計算機視覺技術做簡單巡航自動駕駛,逐漸隨著(特斯拉音譯)幾次車禍之後進入公眾視野。


    第三個,從人臉識別過程來講,兩三麵時間裏麵進入跨越式發展。這個發展不是說我們人為講的,而是基於測試數據。比如有一個人臉數據庫上麵,人臉識別錯誤率從5%下降到0.5%,大概是10倍錯誤率下降。還有之前認為在四年之前的時候,認為說刷身份證去和持有人對比是不是合法持有人這件事情,在四年前我們認為這件事情非常難,可是現在變的現實了可以做的比人還準。這種係統很多廠商公司可以做這件事情,基本可以替代人比人做的比較好的這樣一件事情。


    第四個,自動圖題技術,給計算機一張照片,計算機生成一段話表述這張圖中的內容。對小學生要求一個看圖作文,這件事情在幾年前不可想象,可是在過去一兩年時間裏麵一些研究組取得了非常好的結果,計算機自動生成這些描述可以以假亂真,讓人難以判斷到底計算機生成還是人寫出來的,這些進步比較實在。這些進步導致了大家對於人工智能這樣一個話題越來越感興趣。


    實際上人工智能這樣一個熱潮背後,應該說是有幾個大引擎起作用。第一個引擎,非學術界人知道所謂深度學習,並不是一個新的創新,我們甚至認為其實上個世紀80年代時候出現,或者已經是非常好的模型,那個時候出現。計算機視覺為例,左邊這些圖右邊這些圖都是最早1989年的時候,其實我們用的還是卷近式的網絡。這些變種一個非常顯著的變化,這個層次越來越深,比如說從98年軍進深(音譯)這個概念提出來,等等這些模型都是上個世紀80年代以後出現了。更多是一個多層人工智能神經網絡一個複興。


    第二個就是大數據,這一點也是非常重要的。剛才提到說深度學習它的基本模型在上個世紀80年代出現,為什麼那個時候沒有像現在做的那麼好?當時缺少條件就是大數據,大數據出現讓我們認識到深層次神經網絡模型它的優勢。很多人知道計算機視覺領域2012年時候出現非常大的進步,這個進步就是競賽,為什麼這一年競賽裏麵最好的結果用深度學習之後錯誤率比第二年降低了10個百分點,傳統方法可能是26%的錯誤率,用到深度學習之後變成10%的錯誤率,這是非常大的進步。


    此後這幾年算法精度不斷提高,錯誤率到16%到現在三點幾。這裏麵非常重要一個起動,為什麼在12年,2011年前後的時候,斯坦福大學李菲菲(音譯)構建了一個數據集,這裏麵數據千萬量級,使得這些深度模型它的潛力被挖掘出來。


    第三個引擎,高性能計算。現在大家做計算機視覺等等知道大量學習是在GPO等等平台上進行,而這個GPO在過去幾年時間裏麵逐漸走向曆史舞台。我們這些模型深度學習模型都有大量參與要學習,600多萬參數學習。這樣大規模學習需要非常強的計算能力。


    第四個,還有一個引擎所謂智力眾包,很多研究人員把他們模型、算法、數據進行開元,這裏麵包括深度學習的模型,以及一些開發深度學習模型的平台,這些平台出現使得大家可以越來越多人有機會進行深度學習研究。這個就像火箭一樣,有不同的引擎,這些引擎使得我們可以能夠做大量工作。


    當然我們需要判斷這一輪人工智能熱潮有多大?再過幾年人工智能打敗人甚至統治地球,在研究員眼裏麵這些論斷過早。理性判斷進步應該說這一輪人工智能通用性得到大大的提高。比如說人臉識別,過去我們其實做人臉識別的人采取技術方案,往往其他的貓臉等等用的方法不一樣,在深度學習之後人臉技術得到深入學習。語音識別裏麵用的也是深度學習,底層技術通用性比過去有了很大的提高。


    還有一個例子,假設五年前我們做安全帽檢測任務。大家覺得人臉識別肯定比安全帽難,實際上我們做安全帽檢測的時候也是非常麻煩,五年前也是半年時間可以做這個事情,現在深度學習來了之後可以用人臉識別模型拿安全帽這些數據訓練深度學習模型也會在安全帽上也是非常好,通用性技術越來越可得。這個非常重要規律不同任務可以共享不同這樣一些技術。


    當然這個對人工智能熱潮來說,人工智能從業者我們希望說這個熱潮不斷持續下去,但是我們注意不要去過渡承諾,避免出現第三次寒冬。有很多東西還是不能做。通用人工智能還是沒有出現,比如說AlphaGo。我們看到很多機器人,但是買了時候是這個樣子,兩年後還是這個樣子,不會自我學習和進化能力。這樣顯然這個人工智能進步也是會大大折扣,從這個兩個角度,一個通用人工智能沒有出現,第二個不具備自我成長能力,使得人工智能智力成長沒有我們現象那麼容易,需要大量人工智能研究員去迭代它,而不是自己學習和成長。


    對於這個領域而言,我們現在用的都是深度學習。深度學習帶來很大進步,但是深度學習認為是一個有監督大數據一個狂歡。當你有大量人工標注好的監督數據,就是說我們需要給一張照片,這個照片裏麵是張三還是李四需要這個信號,並不知道這個照片裏人是誰?這個是沒有辦法做的。深度學習是一個歸納法,從大量數據裏麵學習,高考時候題海戰術,通過大量作題獲得越來越多一般性知識的總結。


    我們人類學習還有一個非常重要的方法,演繹法。我們從一個公裏出發,可以有很多推論,這個推論可以用到生活裏麵。現在深度學習很難做一個演繹性推理。這種有監督大數據一個需求,使得在過去幾年時間裏麵出現數據工程師等等這樣一些職業,其實大量的錢過去花在算法,現在還要另外一部分錢買一些有標注的數據。比如這張照片,但是我不告訴你這張照片人臉在什麼地方?這就是弱的監督信號。比如從互聯網從搜劉德華,可能1萬張照片的劉德華,可能不是全部是劉德華,這些髒亂差的數據如何學習,這也是一種能力。


    對於機器人來說,要想認貓目前有大量數據給它,才能認的比較好。還有這次深度學習的熱潮,大家可以認為是一個從過去專家係統到一個數據驅動模式變遷,過去非常依賴於專家知識,告訴計算機編程序,使得人工係統可以知道這個任務,這次熱潮我們在數據裏麵學,不再依賴於專家。人類學習很多時候當專家起很大作用引導,實際我們認為未來也需要專家知識和數據聯合驅動。


    另外,雖然這次我們的深度學習是從過去人工設置專家的特征和知識,教計算機怎麼做到數據來教,結構還是人設計。未來我們相信可能結構也要從數據裏麵學。


    還有交互式學習,我們希望機器自己去學習。買了一個機器人回家,通過跟家庭成員交流,聊天,這個過程當中家庭成員會糾正他的錯誤,機器人不斷能夠成長和進步。包括他自己去看書,到互聯網上上網,或者去看電視也可以去學習。大家知道小兵跟大量網友聊天可以學到很多東西,但是也可能學壞。還有一個特點,我們討論是在中國環境下麵,人工智能我們是不是走到前麵還是落後,總體來說我們應該處於追趕狀態,主要非常重要模型提出者主要還是在北美,當然還有華人做的貢獻。這些平台我們還是有一些劣勢,另一方麵這些國際行業巨頭也有一些寡頭化趨勢。


    學術界互動裏麵,某些問題上學術界走在工業界後麵,主要原因學術界缺少對數據掌握,使得學術界很多研究人員甚至領域前沿問題難以把握,這是值得注意一個趨勢。


    最近講了一個觀點,學術界和工業之間進行互動過程當中存在一個鴻溝。學術界人往往需要從第一步走到一百步的時候滿足用戶需求,學術界可能走出30步,中小微企業沒有走前麵更多的步驟,可能從70步走。中間40步可能更多是吵架,導致很多東西進步緩慢。工業界和學術界往中間走一走,把中間這個40步彌補。我們有一些科技公司,在嫁接學術界和工業界中間進行嫁接技術,把這個40步走完。


    還有一點,我覺得這次人工智能熱潮出現,在很多程度上取決於整個領域大家越來越多開元、開放、數據共享,這樣現象有一個概念叫火旋風,比如說在草原上起了很多火點,當達到一個密度之後,形成一個非常高的龍卷風火旋風。很多一些火點他們能夠形成一個良好的互動,就會出現這樣一種現象。回到我們人工智能這個領域裏麵,我認為大家需要有一種精神開元、開放和能夠有更多共享,這種共享也可以在平台方麵,也可以基礎元代碼方麵,以及數據方麵,大家一起評估這個領域的進步有關係。大家做共享的時候,有機會形成人工智能的火旋風。


    本人過去一段時間裏麵成立一個公司,依托在我們單位裏麵,把這個實驗室做成企業研究院,我們公司承擔走中間40步作用。我們有一個開元一套人臉識別引擎,這是一個全開元,全自動人臉識別的係統。這裏麵實現人臉識別、定位等等功能。同時共享一些數據,開了一些公眾號和大家共享計算機視覺領域一些進步,這些進步我們邀請前沿一些專家撰寫,共享給大家。


    我們考慮對人才培養,以及通過一些合作回饋學術界等等一些工作。當然我們希望能夠理性推介AI這個領域的進步。謝謝大家!

本文來源於"中國人工智能學會",原文發表時間" 2016-10-26 "

最後更新:2017-05-23 16:04:01

  上一篇:go  解決流動人口管理的世紀大難題,政務大數據如何助力
  下一篇:go  躋身數據科學領域的五條職業規劃道路