閱讀785 返回首頁    go 阿裏雲 go 技術社區[雲棲]


專訪北京飛搜科技:一個創業公司該怎樣在人工智能大潮中成長

訪談北京飛搜科技:一個創業公司該怎樣在人工智能大潮中成長 

北京郵電大學董遠教授指導北京飛搜科技獲得VOT2017第二名

作為計算機視覺頂級會議的ICCV2017在美麗的意大利威尼斯成功落幕,40%的投稿來自中國,華人學者繼續在AI領域引領一股思潮,無論是對於學術界還是工業界都能帶來很多啟發。每一屆的ICCV workshop比賽都吸引了包括穀歌,微軟,FaceBook等巨頭公司參加,可謂明星璀璨,而ICCV的workshop更關注算法的某一領域算法的極限性能,因此能在workshop中獨占鼇頭的隊伍代表了該領域的最高水平。在COCO比賽中,以商湯,曠世為首的中國團隊斬獲多項冠軍,將FACEBOOK,GOOGLE等巨頭公司甩在身後,備受矚目的領域檢測,分割等領域有了新的算法高峰。

而作為視覺跟蹤領域的最高峰,VOT(visual object tracking challenge)競賽,吸引了來自全世界的38個隊伍參加(英國伯明翰大學,北京郵電大學,卡內基梅隆大學,中科院,大連理工大學,法國科學院,美國GE,香港理工,地平線,華中科技大學,國防科大,美國海軍研究院,加州大學,牛津大學,中國科技大學,浙江大學等),總共有51個追蹤器的結果。由於每年的評測序列都會更新,且標注的精確度一年一年提高,該競賽也被視為視覺跟蹤領域最難的競賽,遠遠超過了其他數據集。因此,每年最好的追蹤算法都會在上麵一展拳腳,在激烈的比拚中擦出靈感的火花。

在公開的38個隊伍、60個序列的排名中,大連理工大學的盧湖川教授隊伍奪得第一名。由北京郵電大學董遠教授指導,北京飛搜科技何智群、樊應若、莊駿飛、白洪亮組隊提交的結果獲得第二名(CFWCR)。

至頂網特約采訪了指導北京飛搜科技獲獎的北京郵電大學董遠教授。

記者:北京飛搜科技,作為一個創業公司,做核心算法的精力和資源應該非常有限,而且公司成立時間也不長,您能評價一下為什麼一個小型創業公司能夠取得這樣的好成績。

董遠:一個小型創業公司能取得這樣的成績確實不容易,因為核心技術需要多年的沉澱,但北京飛搜科技的科研能力不是從零開始的,公司的核心成員來自原北京法國電信研發中心圖像搜索組,公司的CEO白洪亮博士以前就是法國電信圖像搜索組的組長,公司的副總經理馮文建是原法國電信北京研究中心的首席運營官COO,公司的部門負責人也是原法國電信的研究員。

這個圖像搜索組由白洪亮博士領導,在法國電信研發中心裏具有光榮的曆史和聲譽,該研究組從2008年到2014年,連續6年在美國國家標準與技術研究所(National Institute of Standards and Technology | NIST)舉辦的當時世界上視頻檢索的最權威比賽 NIST TRECVID 上名列前茅。2013年、2014年又分別兩次獲得微軟在西雅圖舉辦的BING圖片檢索評測(MSR-Bing Image Retrieval Challenge (MSR-Bing IRC) at Bellevue, WA, USA)亞軍。2014年獲得華為舉辦的移動視頻標注比賽(uawei Accurate and Fast Mobile Video Annotation Challenge, IEEE ICME 2014)最高性能獎。 參加世界評測獲獎,對這個隊伍來說,就是輕車熟路。

由於法國電信在中國沒有業務,所以這個組隻為法國電信在歐洲和非洲的圖像搜索業務提供技術與支持,在中國沒有直接的業務。2012年,法國電信研發中心為采購人臉檢測技術,評測了法國若幹商業人臉檢測引擎、face.com(後被facebook收購)的人臉檢測引擎和法國電信北京研究中心圖像搜索組的人臉識別引擎,白博士領導的圖像搜索組的引擎勝出,從此北京法國電信北京研究中心圖像搜索組的圖像搜索技術和人臉搜索技術就開始在法國電信集團的業務中得到應用。

2015年,為了響應國家雙創的號召,由白洪亮博士引導,這個隊伍的核心成員離職,開始了創業。

記者:您怎麼對法國電信這麼了解?您為什麼選擇與北京飛搜科技合作呢 ?

董遠:我在2004年到2014年在法國電信北京研究中心任多媒體搜索實驗室主任,下轄圖像搜索組、語音搜索組、文本組、開發組,主要為法國電信集團在歐洲和非洲的Orange TV 提供多媒體搜索的業務提供核心技術支持。2015年,我回高校教書去了。然後,我們這些“法老”(我們戲稱法國電信老同誌為“法老”)就又合作了。

記者:北京飛搜科技目前在哪個方向發力,目前在哪些方向上具有核心競爭力?

董遠:鑒於北京飛搜的起源,目前公司的主要核心競爭力還是在圖像與視頻分析,主要核心技術點在人臉檢測、人臉識別、人臉搜索、圖像識別、視頻自動結構化分析等領域。

公司在2015年主要發力在重新編寫code,去掉一些核心算法知識產權的問題,然後重新評估了一下自有知識產權的性能。

比如,在人臉驗證1:1(Face Verification),北京飛搜科技的實時人臉識別算法,在世界公開測試基準數據集Labeled Faces in the Wild(LFW)上準確性達到99.67% ,針對同一數據集穀歌的準確率為 99.63%。我們的人臉識別算法,躋身國際一流水平。

在1:N人臉搜索方麵,2015年10月,北京飛搜科技的人臉識別算法,參加了華盛頓大學舉辦人臉搜索比賽,測試基準數據集是MegaFace的100萬張人臉數據集。當時獲得第一名的是俄羅斯的NTechLAB,首選正確率為73%;獲得第二名的是穀歌,首選正確率是70%;第三名就是北京飛搜科技,首選率是64%。 這次比賽之後的兩年之內,又有一些其他隊伍逐漸在這個數據集上開始刷分,騰訊優圖於2017年4月把megaface數據集的首選準確率刷到了 83%,成績目前領先。

北京飛搜科技的實時人臉檢測算法,在世界公開人臉檢測評測平台FDDB上,準確率達到95%。 躋身一流性能。

目前公司平均每年申請20餘項目發明專利,軟著20多個。

目前公司在智能安防、智慧城市、智慧園區的項目,需要有在視頻中對人、車輛進行目標跟蹤的技術需求,我們為此開發了這項目標跟蹤技術,然後我們就順勢參加這個全球視頻目標追蹤最高水平的MOT2017 比賽,能獲得這個好的名次我們也很高興,但也不意外。

記者:如何評價AI智能大潮下,目前中國這個多人臉識別公司和圖像處理公司如雨後春筍般的出現。

董遠:隨著人工智能的火熱,確實目前國內有大量人臉識別和圖像識別的公司,但能做好核心技術的公司還是不多的,而持續的核心技術更新就更困難。目前國內深入了解深度學習的人才少而貴。作為技術公司,限於人才的短缺和高端人才的價格也很高,企業能夠把核心技術堅持下來並持續保持世界前列,實屬不易。

記者:很多公司說自己的人臉識別技術達到99% 了,超過人類了,是否是這樣?

董遠:1:1 人臉識別,機器根本超不過人類的辨別能力,因為人臉有“氣質”的區分的,人能分別出這種“氣質”,而機器是看不出來的。人能識別出雙胞胎,但機器不可能做到。如何讓機器能夠學習出這種“氣質”,是需要大量標注數據的,但問題是,人們還不知道怎麼標注出這個“氣質”。

1:N 人臉搜索,機器能超過人類,特別是當N大於5000以上時,那是因為人是會累了,而且也記不住那麼多人。

對於視頻流中的動態人臉識別,光照、分辨率、姿態、人臉質量、帶帽子口罩眼鏡等情況,使得人臉識別遠沒有能夠被理想應用的狀態。而且怎麼樣能夠降低人臉識別的硬件成本也是一個嚴重的問題。

雖然一個人臉識別是一個簡單的詞句,但裏麵的技術非常長多,越做發現問題越多。人臉識別研究遠沒有結束,或許隻是才開始。

記者:人臉識別、圖像識別的市場點是什麼

董遠:現在是智能安防、智慧城市、智慧園區, 將來可能是自動駕駛、機器人、電視視頻內容自動分析、手機視頻內容分析。

記者:如何評價獨角獸,創業公司還有機會嗎?

董遠:獨角獸帶動了整個行業是好事。技術型公司,不像互聯網+公司及 O2O 公司, 技術需要持續發展,發展中就有機會。10年前在人臉識別領域就有獨角獸,但隨著深度學習的發展,目前在這一領域的新獨角獸(比如商湯和曠視)就超越了老的獨角獸 。

同時,AI需要對客戶的定製服務與支持,服務不是產品,多樣化定製的服務在市場中還是有機會的。

記者:怎麼評價目前中國的人工智能熱?

董遠:人工智能還是一個大概念,目前的一輪人工智能熱是由深度學習帶起來的,深度學習在圖像(比如人臉識別、色情圖片分析)、語音識別、文本分析、用戶行為分析都得到了落地應用,以後的應用會越來越廣泛。

記者:怎麼評價 AlphaGo Zero 如此成功,人工智能離實用還遙遠嗎?

董遠:深度學習是基於數據的,數據是需要標注的。 圍棋是一個比較簡單的情況,機器通過觀察棋子是否被圍上就可以斷定答案,從而實現非監督學習。 但比如人臉、語音、圖像,機器無法斷定答案的,所以很難做到完美的非監督學習,所以人工智能裏實用還有很長的路要走。

董遠:北京郵電大學,教授,博士生導師,1999年獲上海交通大學通信與信息係統博士學位,發表學術論文百餘篇,專利申請40餘項,授權專利16項。

董遠工作經曆:

2004年-2014年,北京法國電信研發中心有限公司多媒體搜索(Media Search Lab)實驗室主任。在法國電信工作的10年期間,主持研發數十項多媒體音頻、視頻、文本搜索的核心算法為Orange在歐洲和非洲的多媒體內容搜索服務提供軟件服務,並為此被授予法國電信集團專家 (France Telecom - Orange Expert),成為法國電信集團在多媒體搜索領域的白皮書(white paper - 戰略方向)的製定者之一。

2001-2003年,英國劍橋大學工程係博士後,擔任歐盟項目CoreTex劍橋大學方麵的主要研發人員,參與了當時世界排名第一的語音識別係統的研發(HTK team, Cambridge, UK)。

1999-2001年,Nokia中國研發中心,任R&D Scientist , 是Nokia手機中文語音識別的主要開發人,即Nokia中文語音撥號。



原文發布時間為: 2017年11月9日

本文來自雲棲社區合作夥伴至頂網,了解相關信息可以關注至頂網。

最後更新:2017-11-15 14:05:14

  上一篇:go  信息惠民新樣板 智慧濰坊新名片
  下一篇:go  GNTC頂級大咖共繪網絡技術發展藍圖