閱讀282 返回首頁    go 阿裏雲 go 技術社區[雲棲]


CCL 2017最佳論文公布,看全國計算語言學前沿研究

10 月 14 日、15 日,由中國中文信息學會(CIPS)舉辦的第十六屆全國計算語言學會議(CCL 2017)暨第五屆自然標注大數據的自然語言處理國際學術研討會(NLP -NABD 2017)於江蘇南京召開。

本次會議共收到 264 篇投稿,錄用 105 篇論文,錄用率為 39.77%,共有超過 700 名計算語言學研究者和其他領域的專家學者參與本屆會議,參會人數為曆屆最多。

image


大會主席,中國工程院院士倪光南在開幕式上致辭。

image


他表示,語言是信息最重要的載體,隻有計算機有處理語言的能力時,計算機才能通過圖靈測試,實現人工智能。因此語言智能是人工智能的核心。而信息時代以來,數字信息有效利用成為資源信息技術發展的一個全局性的瓶頸問題,語言信息處理已經成為信息科學技術長期發展新的戰略製高點。而全國計算機語言學學術會議,為研討和傳播我們中文信息處理,尤其是計算語言學最新的技術和學術成果,提供了高水平的深入交流平台。2017 年,我國政府將人工智能升到國家戰略高度,對 2030 年之前的中國人工智能產業進行了係統部署。在新的曆史條件下,中文信息處理領域能否抓住這個重大機遇,對長期的研究和發展沉澱的基礎上勇於創新產生重大突破,是我國中文信息處理裏麵必須回答的一個重大問題。希望此次大會能推動我國科技科學者在自然語言處理方麵取得更多的成果,為我國中文信息處理事業開展新的發展階段。

西安交通大學人工智能與機器人研究所教授、 IEEE Fellow、中國工程院院士鄭南寧做了以《受腦認知和神經科學啟發的人工智能》為主題的主旨報告。

image


鄭教授認為,隻有了解大腦,才能發展出更「健壯」的 AI。想要實現這類不僅在智力上超過一般人類,也在人類習以為常的複雜場景任務中取得卓越的表現的 AI,還應該從腦認知,神經科學,以及人與環境交互的過程中尋找新的方法。經典的人工智能基本理論,以演繹邏輯、語義描述以及形式化的方法來應對問題。換言之,隻要能夠形式化的任務,都可以用當今馮諾依曼架構的計算機以及當今的人工智能方法來解決。但是,由於條件問題(無法舉出一個問題的所有條件)和分析問題(無法給出一個問題的所有分析),研究者無法對所有對象建立模型,也就無法用演繹邏輯和形式化的方法來解決複雜的、處於動態變化環境中的問題。人工智能的局限性,表現在以下五個方麵:無法將問題抽象成有精確數學意義的模型,無法對已建立的數學模型設計出確定的算法或計算過於複雜,無法表現出真實世界的脆弱性和不確定性,隻能進行可遞歸化的計算、處理可向量化的數據。

image

因此要向大腦中尋求人比機器強的地方,例如想象力、創造性、複雜性和動態性,找到將其融入人工智能係統的方法,建立中國新一代人工智能規劃中提到的「混合增強智能」框架。

image


清華大學社會科學學院院長、清華大學心理學係係主任彭凱平教授則從心理學角度介紹了人的智能的優越性。

image


他坦陳如今傳統心理學範疇內的人類智能,如學習、記憶、判斷、分析、決策等認知能力都在逐漸被人工智能超越,然而除了「Brain」之外,人類還有「Mind」,即腦所產生的意識、心理、活動狀況等。新興的積極心理學,從達爾文以「自然選擇,適者生存」與「性選擇,美者生存」為核心觀點的進化論出發,發現人類的進化曆史幾千萬年的組織形態學變化,選擇的都是人的一些獨一無二的天性,這些天性現在看來可能是人比其他的生物要優越的地方,也可能是人迄今為止比機器優秀的地方。這些天性並不是我們傳統上認為的認知加工能力的優勢,而是進化選擇出來的人類獨一無二的積極心理能力。積極心理能力包括:從兩歲半左右開始獲得的與間接學習相關的同理心,從五歲左右開始獲得的延遲滿足的自控力,六個月就已經具有的天然道德意識,以及本能的對未來憧憬和計劃的前瞻意識。積極心理學家認為這就是人類的智能優越之所在,以及這也許是人工智能的研究未來的探索方向。

香港科技大學計算機係新明工程學講座教授,大數據研究所主任及計算機係主任楊強做了《從深度學習到遷移學習》報告,探討了深度學習在小數據、可靠性等方麵的弱點,介紹了近期遷移學習的進展,以及一些可能彌補深度學習不足的研究方向。

image


北京大學數學科學學院教授耿直以《從相關到因果:因果推斷》為題,介紹了相關關係與因果關係的概念及形式化,如何由部分變量推斷因果作用,如何確定替代目標的準則及問題,以及因果網絡的分解學習方法、主動學習方法,並探討了如何評價因果作用和挖掘因果網絡的統計方法。

image


搜狗公司 CEO,前搜狐高級副總裁、首席技術官王小川介紹了搜狗公司基於「讓表達與獲取信息更簡單」的使命,發展以輸入法和搜索為核心的信息處理技術,並在「自然交互知識計算」的理念下,在對話、問答和機器翻譯方麵探討產品需求和技術難題的實踐。

image


除此之外,還有 20 位研究者就機器翻譯中的分詞、未登錄詞問題,知識圖譜的關係抽取和推理問題等多個方向給出了四場口頭報告。近 10 家公司在會場進行了係統展示。

image


15 日,大會公布了評選出的兩篇 CCL 2017 最佳論文獎,一篇 NLP -NABD 2017 最佳論文獎,一篇最佳張貼報告展示獎和一篇係統展示獎,以下是獲獎論文的介紹:

CCL 2017 最佳論文獎

論文:基於 E-CNN 的情緒原因識別方法
作者:慕永利,李暘,王素格
地址:https://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-058.pdf

image


摘要:文本情緒原因識別作為一個新型的研究方向在文本情緒分析領域占據重要地位。本文結合卷積神經網絡,提出了一種基於集成卷積神經網絡的情緒原因識別方法。該方法通過詞向量、卷積、池化等操作充分融合了句子的語義信息,利用多個 CNN 集成降低數據不平衡性對情緒原因識別的影響,克服了傳統情緒原因識別方法的繁瑣規則製定、特征抽取、特征空間降維等過程。實驗結果表明,本文的方法在情緒原因識別方麵取得了較好的效果,對於情緒歸因的方法研究具有一定的指導作用。

論文:融合概念對齊信息的中文 AMR 語料庫的構建
作者:李斌,聞媛,宋麗,卜麗君,曲維光,薛念文
地址:https://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-034.pdf

image


摘要:作為一種新的句子語義表示方法,抽象語義表示(AMR)將一個句子抽象為單根有向無環圖,已經建立 了較大規模的英文語料庫。然而,句子中的詞語和 AMR 圖的概念對齊信息缺失,使得自動分析效果和語料標注 質量受到影響,同時中文尚無較大規模的 AMR 語料庫。本文介紹了中文 AMR 語料庫的構建工作,針對漢語特 點調整了 AMR 的標注體係,增加對複句關係的標注,提出了融合概念對齊的一體化標注方案,解決了中英文輸 入法頻繁切換的問題,增加了錯別字糾正和未標注詞高亮功能,提高了標注效率。然後,從 CTB 中選取了 6923 句進行人工標注,形成中文 AMR 語料庫,統計得到圖和環的比例分別為 48% 和 1%,以及利用對齊信息才能獲 取的非投影句的比例 32%,為中文 AMR 的理論和自動分析研究奠定基礎。

NLP -NABD 2017 最佳論文獎

論文:Using Cost-Sensitive Ranking Loss to Improve Distant Supervised Relation Extraction
作者:Daojian Zeng, Junxin Zeng, Yuan Dai


image

CCL 2017 最佳張貼報告展示獎

論文:兒童外語學習認知數據收集的在線遊戲框架
作者:馬為之,張敏,張琛昱,陳憶馨,謝倩,孫煒嶽,劉奕群,馬少平
地址:https://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-056.pdf

image


摘要:近年來,人工智能技術飛速發展,不少工作試圖從人類的認知發展過程中探索前進方向,語言學習 認知的過程成為了重點關注的研究領域。已有的語言認知研究工作主要集中在學齡前兒童母語的詞匯學習認知方麵,依賴於 WordBank1 等大規模語料庫。然而就我們所知,目前在第二語言學習方麵研究不多,尚未有大規模的第二語言詞匯學習數據,且傳統的數據收集方法難以收集到大規模數據,這也一定程度上限製了對於第二語言學習的研究工作及母語與第二語言學習的比較。針對這一問題,本文針對學齡前兒童群體設計了基於遊戲性原則的數據收集方法和研究框架,用於收集第二語言的語言學習情況和用戶數據,以支撐相應研究工作的開展。目前,我們已經實現了針對學齡前兒童的第二語言為英語的詞匯認知數據收集係統,正在進行在線的數據收集。

CCL 2017 係統展示獎

係統:“九歌”古詩自動生成係統
作者:清華大學自然語言處理與社會人文計算實驗室

九歌是清華大學自然語言處理與社會人文計算實驗室研發的自動詩歌生成係統。九歌研究團隊由孫茂鬆教授帶領,下含兩博士生、兩名碩士生及多名本科生。九歌係統采用最新的深度學習技術,結合多個為詩歌生成專門設計的不同模型,基於超過 30 萬首的詩歌進行訓練學習。九歌係統能夠產生集句詩、近體詩、藏頭詩、現代詩等不同體裁的詩歌。該係統在生成詩歌的質量上有顯著提升。作為一款融合現代技術和中國古典文化的有趣應用,九歌在推動自然語言處理技術發展,弘揚中華優秀傳統文化等方麵都有所幫助。

原文發布時間為:2017-10-17
本文作者: 邱陸陸
本文來自雲棲社區合作夥伴“PaperWeekly”,了解相關信息可以關注“PaperWeekly”微信公眾號

最後更新:2017-10-17 17:03:37

  上一篇:go  阿裏雲國外服務器需要備案嗎?阿裏雲海外免備案服務器
  下一篇:go  10月17日雲棲精選夜讀:什麼是新零售?阿裏巴巴最新的報告終於說清楚了!(附報告)