637
技術社區[雲棲]
專訪劉昕博士:深度學習與人工智能
劉昕,博士畢業於中國科學院計算技術研究所,師從山世光研究員。博士階段主要從事人臉識別與深度學習技術的研究與工業化應用,作為第一主力或並列第一主力獲得ICCV 2015 年齡估計競賽亞軍、ICCV 2015 文化事件識別競賽冠軍和 2015 年度阿裏巴巴天池大規模圖像檢索競賽總決賽冠軍。2016年8月起,擔任人工智能初創公司中科視拓公司CEO,並先後獲得兩輪投資,投資人包括線性資本、紫牛基金、明勢資本和安賜資本。
ArchData技術峰會將於9月9日上海徐匯區田林路COCOSPACE開幕,在大會之前,中生代技術特邀專家記者王公仆對劉昕博士做了會前訪談
王公仆:劉博您好,首先感謝您花費寶貴的時間來參加ArchData峰會,給大家分享深度學習理論與人臉識別應用相關的技術話題,正式會議前,我這裏有一些問題想請教您:
王公仆:您的博士生導師山世光先生是人臉識別領域的國內知名研究員,你們所在實驗室也是國內最早開展人臉識別研究的單位,從97年至今來一直在從事計算機視覺領域相關研究,請問當初是什麼樣的動機讓您們從科研院所走出來創業的呢?
劉昕博士:主要原因有兩個。其一是大環境鼓勵科研人員走出去,加速科研成果的轉化。其二是我們希望能通過走出來創業,獲得資金和數據上更大的支持,更好的實現計算所要求的“科研為國分憂,創新與民造福”。
王公仆:請問在人工智能計算機視覺領域創業火熱的當下,中科視拓將如何與商湯科技,Face++,馭勢科技等企業競爭呢?
劉昕博士:事實上,計算機視覺領域有一塊很大的蛋糕,可以落地的場景非常多,比如人臉識別技術可以應用在安防、金融、實名製上,通用視覺識別技術可以應用在無人駕駛、無人機視覺中。今天計算機視覺技術還處在快速發展階段,存在不少技術上的盲區,因此市場的想象空間還無比巨大,遠遠未達到存量市場的競爭階段,因此不同的創業公司事實上是在相互協作,共同探索計算機視覺技術的未來。
王公仆:作為深度學習專家,您對人臉識別技術的成熟度是怎麼看待的呢?典型的應用場景會有哪些?
劉昕博士:人臉識別的成熟度在不同應用場景下差別很大。目前比較成熟的應用場景包括1:1條件下的人證實名製比對,例如中科視拓的人證比對一體機,已經在公證處、運營商營業廳、機場火車站實名驗票等領域獲得成功應用。再比如1:N(N<1萬)場景下室內半配合環境的無卡考勤與門禁係統,高清證件照條件下的大庫檢索係統等。相對來說成熟度不足的有1:N(N>1億)條件下的刷臉支付,無配合的監控條件下動態人臉識別等。
王公仆:之前我曾在安防龍頭企業海康威視工作過2年,深知安防產業數據存儲的壓力,尤其高清攝像頭拍攝的畫麵,在計算機視覺技術逐漸成熟之後,它會給安防行業帶來哪些實質性的價值呢?
劉昕博士:海量的數據會帶來很多方麵的價值,比如對於深度學習而言,海量的數據加上人工的標注是實現智能的基礎。再比如,海量的視頻數據也使得智能交通、人臉黑名單監控、車輛行人的軌跡追蹤等計算機視覺應用擁有了基礎條件。
王公仆:您曾經作為第一主力或並列第一主力獲得 ICCV 2015 年齡估計競賽亞軍、ICCV 2015 文化事件識別競賽冠軍和 2015 年度阿裏巴巴天池大規模圖像檢索競賽總決賽冠軍,能分享下團隊取得這麼優秀的成績的經驗嗎?
劉昕博士:在實踐中我們獲取了很多經驗,在這裏給大家分享其中三個:
首先,要有足量的訓練數據,利用海量的訓練數據和遷移學習技術,我們可以在競賽的小數據集上獲得更好的模型精度。
其次,需要有算法創新的能力,例如我們在阿裏巴巴天池大規模圖像檢索比賽中就使用了標簽噪聲魯棒的新學習算法。
最後,需要有足夠的算力支撐,對於一個競賽而言,擁有足夠的GPU也是快速迭代算法和模型的基礎。
王公仆:您作為中科視拓CEO,還擔任著深度學習大講堂微信公眾號的執行總編樂於給大家分享技術知識,請問對於非機器學習的研發工程師該如何學習成長從而進階成為一個機器學習工程師呢?
劉昕博士:我的建議主要有三個:
第一點,重新找回對數學的感覺,這裏麵高等數學、線性代數和凸優化是必須掌握的數學知識。
第二點,熟悉至少一種深度學習框架,作為工業界使用,推薦Tensorflow,MXNet和PyTorch。
第三點,瞄準一個領域,比如計算機視覺,語音識別或自然語言處理。中科視拓在實習生培養和新員工培訓中,也主要圍繞這三個方麵展開。
王公仆:目前機器學習和深度學習都有許多框架,在這些框架的選擇方麵您有什麼經驗和建議給到初學者?
劉昕博士:事實上,隨大流一般不會有錯,因為社區的繁榮與否往往決定了入門和深入的難度。有Python背景的工程師可以很快上手Tensorflow,MXNet,PyTorch這樣上層基於Python的深度學習框架。這裏特別推薦一下中科視拓的實習算法研究員潘汀(同時也是中科院計算所的博士生)主導開發的Dragon框架,通過獨創的虛擬化框架技術,實現了對不同框架的統一調用。
王公仆:一個人工智能項目需要在軟件算法,硬件算力和大數據積累等三個層麵優化,產品才能有最好的表現,能給我們分享下你們的人臉識別相關產品在這三個層麵的積累或優勢嗎?
劉昕博士:從算法上,我們在小數據深度學習、髒亂差數據深度學習和零數據深度學習方麵都有著自己獨創的技術,我們稱之為X數據驅動的深度學習技術。在算力方麵,中科視拓也構建了一個大規模的GPU計算集群。在數據方麵,中科視拓擁有千萬人規模,數以億計的人臉數據和數以千萬計的車輛、行人和無人機視覺數據。
王公仆:隨著人工智能的持續火熱,也引起了一些專家對未來智能機器人的擔憂,比如最近埃隆·馬斯克聯合百名人工智能專家唿籲聯合國立法禁止機器人武器,您對人工智能未來的發展怎麼看,會出現失控的可能嗎?
劉昕博士:我認為人工智能未來可期,但現狀還遠達不到人工智能威脅論乃至失控的地步。機器依舊依賴於人類的導師信號進行學習,依賴於繁瑣和數學機製不明確的調參來找到次優解,以及存在難以解釋的實際場景下的bad case。機器依舊是傻傻的依賴於人類智慧來迭代與進步,所以短時間還不會失控。
中生代記者:如何看待AI取代人這個話題?
劉昕博士:在可以預見的10年中,AI將深度的參與到金融、教育、法律、財務、醫療、公共安全等行業,一部分取代人的工作。我自己的一個親身經曆,現在高考誌願填報的時候,準大學生們最關心的是自己所選的專業在畢業後會不會被AI替代。
中生代記者:本次大會的內容,能不能劇透下分享內容?
劉昕博士:本次大會我將首先介紹深度學習的基本概念、基礎理論和方法。從曆史的視角回顧深度學習的兩起三落。最後介紹中科視拓深度學習調參機器人AutoCNN的相關實踐經驗。
最後感謝您接受采訪,謝謝。
原文發布時間為:2017-09-04
本文作者:王公仆
本文來自雲棲社區合作夥伴“中生代技術”,了解相關信息可以關注“中生代技術”微信公眾號
最後更新:2017-09-04 22:03:40