223
機器人
聯想研究院徐飛玉:人工智能之爭歸根到底是人才和數據的戰爭
近年來人工智能領軍人物頻頻接過科技公司的橄欖枝,徐飛玉就是其中一員。
從1988年開始,徐飛玉一直在德國人工智能研究中心(DFKI)工作,該中心是德國頂級的人工智能研究機構,股東包括Google、Intel、 微軟、寶馬、SAP、Airbus等在內的全球頂級企業。徐飛玉曾就任該研究中心語言技術實驗室文本分析研究組負責人以及首席研究員,直到今年3月,聯想CTO芮勇將她挖入聯想,作為副總裁負責聯想研究院人工智能實驗室的研發工作。
這幾年全球市場對人工智能領軍人才的需求急速擴張。徐飛玉博士對第一財經坦言,自己從去年開始就陸續接到很多企業的邀請,但最終還是希望回到中國做一些研究,“把研究結果變為產品是一個非常具有挑戰的過程。”這是徐飛玉的興趣點,也是她所擅長的。
徐飛玉博士曾是DFKI分拆公司Yocoy Technologies GmbH的創始人之一和總經理。Yocoy研發出30多種麵向英語、中文、法語、德語和西班牙語國家旅遊市場的多語言交流助手移動應用。“100多個研發功能,到產品裏可能隻有十個或兩個真正有用,將研發結果和產品戰略連接在一起,並且做成功是非常不容易的。”徐飛玉博士告訴第一財經。
人才和數據之爭
伴隨大數據、分析平台、先進算法的開源以及以及機器學習方法的優化,人工智能已經從實驗室走向日常生活,並催生出機器翻譯、智能搜索、語音助手等商業應用工具,這些工具成為新一輪產業變革的新動力,自然也被科技公司視為布局和角逐的焦點。
但在徐飛玉博士看來,人工智能之爭歸根到底是人才和數據的戰爭。判斷一家公司的人工智能水平,首先要看人才;其次要看是不是擁有自己的數據,可以自成平台;然後就是看有沒有好的商業模式,能夠借助生態係統幫助平台積累數據,形成數據價值鏈條。
而這個過程仍有諸多的工作需要“死磕”和積累。以聯想研究院人工智能實驗室當下正在研發的人工智能客服係統“聯想小樂”為例,該應用主要用於解答專業性的PC、移動等硬件設備疑問,例如當電腦藍屏時,係統可以告知用戶是在哪一環節出現問題,並指導其解決這些問題。
這其中就涉及對話係統、語音識別、圖像識別等人工智能技術,並且需要與懂業務流程的架構師和數據專家一起工作。相較於搜索引擎而言,用戶使用該應用的場景多處於硬件設備出現問題後,所以這套係統必須在短時間內給出更為精準的答案,其中一個很大的挑戰就是數據,特別是高質量的標注好的數據。
在徐飛玉博士看來,理想狀態下,如果數據標注的很好,把算法放上去遷移的難度並不大,國際上有開源的帶標注的數據庫,做一定的調理,用開源的算法,很快可能就比別人做的更好。
但是在產品開發過程中,需要用實際的數據,也需要在外麵找一些數據,這些數據可能是不準確的,甚至是髒的數據。一方麵需要進行數據清洗,然而很多數據都沒有標準,更挑戰的是開發麵對沒有大量標注數據的方案和方法。
另一方麵,要讓機器越來越像人,就必須借助海量數據的持續學習,讓企業、產品的知識圖譜,常識的知識圖譜,專業的知識圖譜不斷成長。最後如果要做出真正好的方案,經常要把不同類型的數據結合起來,例如如何把文字數據和圖像數據連在一起,通過細節關聯做出判斷。
“在智慧城市應用中,每天一個地方堵車的原因可能是因為前方的紅燈設置的不合理,位置或時間的長短有問題。要能自動發現和判斷這個問題,前提是能把觀察車流的視覺傳感器數據和城市交通數據相結合。”徐飛玉舉例說。類似的在智慧醫療中,把CT的圖像數據和醫生的文字診斷數據進行深度結合,才能有效分析圖像並進行自動判斷。
PC互聯網、移動互聯網時代都出現了流量集聚效應,那麼基於人才和數據的人工智能之戰,又是否會出現贏者通吃、巨頭壟斷的局麵?徐飛玉坦承這種趨勢是會有的。
“人才是需要資金去支撐的,沒有一定的資本是著急不來的,同時數據量多的話則可以做更好的應用開發,而現在全部公司都麵臨一個共同的問題,數據化挑戰。”
機器還需學習反問
麵對深度學習過熱現狀,徐飛玉提出深度學習隻是機器學習的一個方麵,其在端對端的應用上起到了很大的作用,但當下的深度學習隻能提供最終的決定。
例如最簡單的Yes或No,這是一個黑箱子,實際上如何把機器學習和數據、知識結合在一起,不僅幫助人類做決定,還能告訴人類為什麼做出某個決定,目前的深度學習方法還是不夠的。
如果應用到一些關鍵領域,例如飛行、醫療診斷、國防、安全等,還要增強解析能力。大數據帶給深度學習強而有力的判斷能力, 但其實機器若要做到“學習”這件事, 深度學習並不是唯一方法。
在她看來,語音是信息交流效率最高的一個渠道,能夠讓人機交互更自然,讓機器更像人,這也是巨頭紛紛入局智能音箱的原因所在。不過從當下發展情況來看,真正具備對話能力,尤其是具備反問能力的機器還比較少見。
例如有四個名為柏林的城市,智能音箱並不會反問是德國首都還是離漢堡很近的小鎮。“語言是多意的,語音更是多義,機器人會出現不懂裝懂,當機器模擬人的時候,需要理解對方,這就要求對話雙方的知識背景不能查太遠,需要借助更多數據讓機器擁有更多常識、解除誤解、學習規則、推理和交互能力。”徐飛玉博士告訴第一財經。
人工智能的哲學思考
麵對創業公司言必稱人工智能和投資機構的爭相追逐,徐飛玉博士認為不能一直用投資者的眼光來看待人工智能,創始人和團隊也不應該被資本的大腦驅動著,而是應該抱有足夠的耐心和好奇心,將自己的工作當作人類科技進化過程的一部分來看待。“科學和創新,需要有信念和堅持。”徐飛玉強調。
這或許和她在德國人工智能研究中心多年工作經曆相關。在徐飛玉的印象裏,德國人做事極為嚴謹,且習慣以批判的思維去看待所有的解決方案,在編寫程序前會將問題理解得非常清楚。
例如會考慮全世界解決這個問題有哪些方法,有哪些算法和工具,各自的優缺點是怎樣的,進展如何。“德國人做事很有方法論,受哲學的影響很大。他們會花費很長的時間來想清楚這些問題,一旦弄清楚執行速度非常快“
相較而言,很多時候國內做事情的速度很快,在將別人想好的事情拿過來做方麵比較快,急功近利了一些,結果想問題的時間短了一些。“創新是一個複雜的係統,前人沒有做,甚至做了部分的事情,多給這些東西一些時間會做出更多的創新。“徐飛玉說。
最後更新:2017-10-08 08:33:49