閱讀339 返回首頁    go 機器人


首次被寫入政府工作報告的“人工智能”,成為了李彥宏的“打拐”利器

時至今日,你也很難估量2011年——微博上一個黃金時期,社科院農村發展研究所教授於建嶸先生發起的“隨手拍照解救乞討兒”活動產生的社會影響力。盡管轟轟烈烈的“人人拍照挽救拐賣兒童”因陷入某種狂熱而遭到質疑,但公眾對這一事件的憤恨,對離散家庭的憐憫,依舊持續產生了在其他事件上並不常見的共情效應——為數不多的社會題材院線電影,甚至有《失孤》和《親愛的》兩部與此相關。

不過現實是,由於查找與辨認兒童唯有靠肉眼並不擅長的照片對比,準確率和效率上都非常有限,仍未從根本上改善這一社會悲劇。也因此,幾乎每年兩會都有人大代表提出與走失兒童相關議案,譬如去年就有代表建議:兒童出生時由政府免費采集DNA,且所有孩子上戶口時必須核對DNA信息。然而經濟學常識是,美好願景與“社會成本”之間存在鴻溝,通過DNA比對需要巨大的技術成本。

一年之後,今年提出議案的換成了科技大佬李彥宏。3月3日,李彥宏在全國政協十二屆五次會議提案:利用已經成熟的人工智能和大數據技術,幫助解決走失兒童問題。

事實上,當人工智能普遍被產業界視作未來社會下一代基礎設施,與之相關的提案當然不隻李彥宏一份,複星集團董事長郭廣昌也提案,希望更多醫療健康行業與人工智能技術相結合——而讓李彥宏和郭廣昌興奮的是,就在3月5日上午,第十二屆全國人民代表大會第五次會議在人民大會堂開幕,“人工智能”首次被寫入全國政府工作報告。

說回李彥宏的這份提案。

其實多年來,輿論強大的共情作用讓不少科技企業都試圖改善這一現象:譬如兩年前頗為火爆的兒童智能穿戴設備,但遺憾的是,後來由於輻射高,續航差,GPS 誤差高等原因,被寄予厚望的可穿戴逐漸淪為一時玩物;此外微博也曾推出過“LBS地域情景化網格係統”,利用用戶位置信息有所作為。

與上述從“邊緣性”突圍的方式不同,李彥宏祭出的手段是過去一年多次提及的人工智能,在他看來,“近年來人工智能和大數據技術不斷完善,應用日趨成熟,有望進一步促進兒童走失案件的偵破。一方麵,人臉識別能夠提升圖像偵查效率,盡早鎖定失蹤兒童或涉案人員。另一方麵,人臉識別能夠實現海量人臉數據的跨年齡比對,幫助偵破兒童走失積案。”

於是問題的關鍵轉向在公眾一端熟悉又陌生的詞匯:人臉識別。今天不妨從技術視角,分析一下李彥宏這一提案的理論基礎。畢竟,相較於DNA,“人臉”是大眾更熟悉且成本低得多的識別對象。

人類思維VS機器思維

進化心理學告訴我們:由於祖先族群內原始的協作需求——以及識別“異己者”和“不合作者”的本能,人類大腦從上百萬年前就演化出了識別人臉的能力。而也正由於這上百萬年“時間差”造成的演化沉澱,識別他人麵孔歸屬於大腦應激反應的所謂快係統,或者說直覺——不過,機器世界裏從來沒有“直覺”二字,有的隻是算法和數據。

這亦是人臉識別技術難度所在。不同於一般圖像識別,人類臉部結構存在極大相似性;且表情易變(人類究竟有多少種表情?我還沒看到特別權威的數字,但至少比“表情包”豐富得多);另外,不同的觀察角度,光照條件,遮蓋物(口罩,墨鏡,頭發,胡須等等)都會增加機器識別難度;更何況喪心病狂的人類居然還通過整容和P圖等行為擾亂機器判斷……

不過即便如此,當如今人工智能已發展到“隻要人類正常情況下1秒就能做的事,它幾乎也能做到”的地步,人臉識別的技術進步也令人欣喜。

顧名思義,作為一種集成了機器學習,模型理論,專家係統,視頻圖像等多種技術的綜合實現方式,人臉識別可以實現人臉檢測,對比以及查找。而這一輪人臉識別精準性的提升,無疑受益於在海量數據加持下的深度學習(作為一次算法革命,深度學習以一種簡練的網絡模型解決了過往印象中極為複雜的思維體係):換句話說,為了在“茫茫人臉”中認出特定麵孔,機器需要先自己“記住”上億張人臉。

這就得說到機器思維的底層邏輯。與人類思維試圖將整個世界簡化和抽象理解不同(大腦帶寬有限,人類對因果關係和“貼標簽”的熱衷皆因於此),機器思維走在了奧卡姆剃刀原則的反麵——人工智能不會將世界簡化,而是從複雜信息中以自己的方式進行篩選。

舉個例子,在那期被廣泛熱議的《最強大腦》人機大戰中,百度人工智能與世界記憶大師王峰通過分析照片中出現的幼年人臉,識別出現場20年後的成年人,然後人工智能贏了,但要知道,截止這場比賽前,百度已經動用大概200萬人次,近2億張照片作為訓練樣本數據,通過提取人臉中相對穩定和細微的特征,完成年齡跨度較大的人像高精度比對。

從“競賽”角度,人類與機器並不在同一起跑線,但也就在那次節目上,初為人母的章子怡女士感慨道:“我們有很多的失蹤兒童,他成長了之後可能連父母都認不出來他的樣子,但小度可以幫我們辨別出來,所以小度要為人類作出更多貢獻。”

不知道李彥宏的兩會提案,是否與此有關。

人臉識別技術路徑

在我看來,已頗為成熟的人臉識別技術,倒不失為一次理解機器思維的好機會。換句話說,李彥宏讓這份提案落地的技術路徑是什麼?

事實上,人臉識別的實現大體可分為四步。第一步當然是人臉檢測:根據眼睛,眉毛,嘴巴,鼻子等器官特征和相互幾何位置關係檢測人臉。第二步則是人臉圖像預處理:如前所述,原始圖像由於受各種條件的限製和幹擾,很多時候無法直接使用,必須在早期階段對其進行灰度校正,噪聲過濾等圖像預處理。進一步剖析的話,這種預處理主要包括人臉對準(得到人臉位置端正的人臉圖像),圖像增強(改善圖像質量,在視覺上更清晰,且讓圖像更利於計算機的處理與識別)以及歸一化(取得尺寸一致,灰度取值範圍相同的標準化人臉圖像)等工作。

人臉識別的第三步就是臉圖像特征提取——這一步是針對人臉某些特征進行的,也是對人臉進行特征建模的過程。最後一步,即是輸出結果的匹配與識別:將待識別的人臉特征與已得到的人臉特征模板進行比較,根據相似程度對人臉的身份信息進行判斷。

以上是適用於所有識別用途的理論路徑,但李彥宏在提案中涉及的場景則更為複雜:“可能孩子是在很小的時候走失的,但他再進入公眾視線可能已經上小學了——比如辦學生證的時候需要拍照片,這種情況下通過人工智能的比對,就有可能比以前更加高效的幫助有關部門和家庭找到走失兒童。”

就像章子怡冀望的那樣,對比走失兒童是“跨年齡人臉識別”技術最具社會價值的實現場景。但在影響人臉識別率的所有因素上,時間往往是最難對抗的部分,原因之一是跨年齡識別中類內變化通常會大於類間變化;另外,跨年齡訓練數據難尋,若沒有海量數據,深度學習神經網絡便很難學習到跨年齡的類內和類間變化。

不過就像在《最強大腦》中展示的那樣,百度也提出了完善的解決方案:針對第一點,百度深度學習研究院“人臉團隊”選擇用度量學習的方法,通過學習一個非線性投影函數,把圖像空間投影到特征空間中,在這個特征空間裏跨年齡的同一個人的兩張人臉距離會比不同人的相似年齡的兩張人臉的距離要小;而針對第二點,考慮到跨年齡人臉的稀缺性,百度通過一個用大規模人臉數據訓練好的模型作為底座,然後用跨年齡數據對他做更新。而將上述兩點結合,通過端到端的訓練,即可以大幅提升跨年齡識別的識別率。

這也正是李彥宏此次提案的理論基礎。

培育共識

事實上,在準備兩會提案時,李彥宏已非常確信技術本身的成熟度。畢竟百度人臉識別準確率已高達99.7%,何況在人臉識別最權威的國際評測——FDDB與LFW中百度獲得了雙料世界第一。另外百度細粒度圖像識別技術在Stanford Dogs,UCSD Birds(CUB-200-2011)等公開測試中也保持世界領先的識別精度。

但更讓李彥宏自信的是,讓技術落地從來都是檢驗技術的唯一標準。其實人臉識別已廣泛應用於諸多領域——最直接的例子是,早在提案前,百度人臉識別就已經用於尋人平台上,平台現對接民政部全國救助尋親網中近3萬條走失人口信息。

不妨再舉幾個最近的例子:去年世界互聯網大會,烏鎮便首次啟用由百度提供的人臉識別係統,很大程度上提高了檢票進景區速度(其實兩會也可以如此);人臉識別是百度風控部門實現遠程授信的技術基礎之一;泰康保險去年底上線了人臉識別I期項目,用於線上微信回訪和微信回執兩個場景,包括人臉識別前端,公安比對,業務銜接以及後台管理等功能。

總之一切指向一點:從技術(包括成熟度和成本在內),李彥宏的這份提案具有很大的可行性,但曆史經驗是:讓社會係統向更美好的方向演進,技術之外,還需要某種合力。

通過人工智能尋找走失兒童亦不例外,它需要與相關部門相互嵌合,根據場景不斷調優。也因為此,李彥宏在提案中的具體建議包括:建立適用於搜尋走失兒童的人臉識別模型;建立覆蓋全國的走失兒童數據庫;將人臉識別技術與治安和交通監控係統相結合等。

在我看來,即便提案延緩落地,也不失為一次在整個社會範疇孕育共識的機會,要知道,人工智能會成為未來服務公共事務的重要方式,但來自政府的頂層支持也是讓作為社會基礎設施的人工智能盡早落地的途徑。令人欣喜的是,這種共識正在形成:就在3月2日,由百度牽頭組建成立的深度學習技術及應用國家工程實驗室正式揭牌,這是中國人工智能領域的首個國家工程實驗室,被視作“國家隊”的正式入場。

嗯,人工智能仿佛一個植入係統,已經改變了購物,金融,媒體,交通,外賣等生活各個日常片段,並期待自己如百年前的電力係統一般為人類延伸出更多的可能。所以你完全可以想象如下場景:《失孤》和《親愛的》中的父母不再通過持續多年的滿城尋覓,而是到公安機關錄入孩子照片,機器通過數據庫對比,尋找到匹配對象,以更能燃起希望的方式,讓故事以相對完滿的結局收場。

李北辰/文

我的文章還出現在鈦媒體,虎嗅,搜狐科技,創業邦,界麵,DoNews,藍鯨TMT,砍柴網,品途網,投資界,領英中國,i黑馬,百度百家,TechWeb,創事記,艾瑞網,Xtecher,雷鋒網,站長之家,A5站長,博客中國,知道日報,數字商業時代,中關村在線,今日頭條,一點資訊,北京時間,網易,騰訊,鳳凰,新浪,知乎等四十餘家科技媒體。

最後更新:2017-11-08 18:59:45

  上一篇:go 人工智能妖王顯露:機構6度增持尾盤大單搶籌,接力京東方A或成妖王
  下一篇:go 人工智能浪潮下的數據中心的機會和挑戰