閱讀912 返回首頁    go 汽車大全


阿裏人工智能連奪兩項世界冠軍

不久前的雲棲大會上,馬雲宣布成立“以科技創新世界”的阿裏巴巴達摩院。

7ab4eebb0248b7916d0f15875fe6b1d1bb916084

最近,達摩院iDST自然語言處理團隊在自然語言處理技術取得的兩項新成績:在全球頂級的知識庫構建測評KBP2017中,斬獲英文實體發現測評全球冠軍;在中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱 CGED)三個level中全麵奪得冠軍,核心指標比其他參賽機構高出一倍。

比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平台。這個平台支持阿裏大生態的每天多達600億次的自然語言處理需求。

這次參賽的是阿裏巴巴iDST自然語言處理首席科學家司羅以及iDST自然語言處理團隊。

3b45b94b4739fdd14c38d44ff456f1c36567d21c

司羅

司羅是全球權威機器智能學者,曾擔任美國普渡大學計算機係終身教授,主持的20餘個項目得到美國政府、工業界資助,先後獲得美國國家科學基金會成就獎、雅虎、穀歌研究獎等。


中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱 CGED)是自然語言處理領域的權威賽事,由IJCNLP聯辦,今年已是第四屆。阿裏巴巴iDST在三個level中全麵奪得冠軍。即便是最難的level,核心指標F1(綜合考慮準確率與召回率)依舊達到了 0.2693,比其他參賽機構高出一倍。

“組辦方給我們一個題目,然後由我們研發係統,然後測評,就是給我一個句子,我挑出出錯的那個地方。” iDST自然語言處理團隊主力成員李林琳表示,這次組辦方給的比賽的背景是:學習中文的外國人數不斷增加,由於中文的博大精深,外國友人在中文寫作中會出現各式錯誤。主辦方挑選了一些外國友人寫的中文作文片段,希望參賽者用人工智能算法自動識別裏麵的語法語義錯誤。

賽題中包含的錯誤分為四種類型:多詞(Redundant)、缺詞(Missing)、錯詞(Selection)和詞序錯誤(Word Order)。係統性能的評估也由易到難分為3個level:detection level(識別句子有沒有錯誤)、identification level(識別錯誤句子的具體錯誤類型)和position level(識別錯誤的位置和對應類型)

6e42feb1d227a269343f46745faa53cdc08bccfd

比賽要求診斷的四種錯誤類型

比如,“我要送給你一個慶祝禮物。要是兩、三天晚了,請別生氣”這句話,在第3個Level,AI需要明確指出“兩、三天晚了”存在錯誤才能得分(正確用法應該是“晚了兩、三天”)。此外,團隊還結合了分詞、詞性、依存句法等特征,同時將language model等無監督的知識embedding到神經網絡。依靠RNN結構以及詞性、依存等特征,不光能識別短程的語法錯誤,比如“一頭牛”好於“一隻牛”;也能識別比較長程的語法錯誤,比如“雖然父母很辛苦,而且對孩子照顧得很好”中“雖然”和“而且“不搭配。此外,他們針對比賽的3個不同level,設計了不同的基於神經網絡的snapshot emsembles方法。

基於深度學習的結果

將被用於這些方麵

據了解,這次比賽中主力成員李林琳,謝朋峻,楊毅等通過在深度學習中引入無監督的語法知識,同時結合了集成學習等方法取得了好成績。

李林琳說,中文語法診斷的挑戰性在於,中文語言知識豐富、語法多樣;人在判斷一句話是否有錯誤的時候,會用到長期積累的知識體係(比如一句話是否通順、兩個詞是否可以搭配、語義上是否成立等)。相比之下,比賽提供的訓練數據非常有限,僅通過訓練數據來識別錯誤是很困難的。

“這是一個基於深度學習的結果。”李林琳說,深度學習有很多基礎模塊,比如做了中文詞匯切分的積累,就是讓AI首先知道什麼是一個詞,比如給AI一句話“我是中國人”,AI可以將這句話切分成“我”“是”“中國人”三個詞,然後要對詞性做一個分析,知道“中國人”是一個名詞,和動詞“是”搭配就是“動詞+名詞”,即動賓短語。如果是副詞+名次,就不對了。這哥基礎模塊就是讓AI係統學習詞性的使用方法。

“還有基於更深度的句法分析,就是要檢查整個句子的語法輸入是否正確。”李林琳舉例說,如果整個句子裏麵,有個主語是名詞,加動賓短語,就是名詞+動詞+賓語,這就是一個合理的句法結構,如果少了動詞,語法上就不正確 。

“整體來說,這次比賽是我們長期在AliNLP方麵的積累、能力方麵的綜合體現。” 李林琳說,比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平台。

中文語法錯誤自動診斷會被運用在什麼地方?李林琳說,AliNLP 平台支持阿裏大生態(新零售、金融、物流、娛樂、旅行等)的每天多達600億次的自然語言處理需求。比如現在大家使用的SNS軟件和對方語音聊天,在一些環境下,不方便聽,或轉換成文字,“這個轉換成文字的過程中,經常會有很多語法錯誤,中文語法錯誤自動診斷就能自動糾錯,使語音轉換的文字更加好理解。” 李林琳說,還有很多網絡媒體的內容質量審核,即需要審核文字內容時,也可以運用到這項技術。

AI不僅能看懂英文

還能做到對文章上下文的理解

另外一項比賽,KBP是由NIST(National Institute of Standards and Technology,美國國家標準與技術研究院)指導、美國國防部協辦的賽事,主要任務為從自然書寫的非結構化文本中抽取實體,以及實體之間的關係。

這項測評要求AI算法在“讀完”一篇英文文章後,構建一個物理世界的命名實體和實體之間關係的知識庫,如“克林頓和希拉裏之間是夫妻關係”、“克林頓畢業於耶魯法學院”這樣一個個實體的關係。

司羅介紹,阿裏的算法可以做到對文章上下文的理解。比如,文章出現了Apple,再出現Jobs,就可以辨別出這個Jobs指的是喬布斯,而不是工作。再比如,文章出現了Microsoft,那麼Apple就更有可能是蘋果公司,而不是一種水果。

“另外,我們構建了一個算法去學習不同領域之間共同的部分,通過遷移學習提升我們學習的準確度。對於不同領域數據,我們取其精華,去其糟粕,進行智能學習”,司羅說。

在這次測評中,iDST團隊采用經過改良的深度神經網絡架構對文本進行理解。改良的架構有三個主要特點:首先該模型可以自動閱讀海量文章(如維基百科)並從中汲取經驗;其次,該架構可以智能選擇訓練數據集以保證訓練數據的準確性;最後,我們采用post regularization的辦法保證模型結果的一致性。

fc1107a4ffffb8213c713357085f1bba519d14f3

參賽機構比賽成績公布

對於KBP2017的成績,司羅表示:“很榮幸能夠同全球的同行分享阿裏巴巴的研究成果,人工智能在機器閱讀理解和知識庫構建上還處在起步階段,我們正在積極和同行業頂尖機構學習交流,推動行業發展。比如我們內部建設的信息抽取平台AliIE項目就在同斯坦福大學展開積極合作”。

阿裏巴巴正在將這樣的信息抽取技術廣泛的應用到實際業務當中,並致力於讓更多的中小開發者從中收益。他們搭建的信息抽取平台AliIE擁有最頂尖的AI技術,並從一開始的架構設計就考慮到平台的開放性和可擴展性。可以讓更多的開發者、研究員共同開發,並將成果回饋給這個社區。


原文發布時間為:2017-11-27

本文作者:汪佳婧

本文來自雲棲社區合作夥伴“天下網商”,了解相關信息可以關注“天下網商”微信公眾號

最後更新:2017-11-29 00:34:18

  上一篇:go  阿裏巴巴正式開源其自研容器技術Pouch
  下一篇:go  物聯網時代之核心 論人工智能未來發展趨勢