閱讀133 返回首頁    go 技術社區[雲棲]


開源代碼“All in One”:6 份最新「Paper + Code」等你複現 | PaperDaily #12


[ 自然語言處理 ]


Earth Mover’s Distance Minimization for Unsupervised Bilingual Lexicon Induction
@paperhwd 推薦
1

文章想解決的問題是如何使用無監督的方法構建雙語詞典,傳統方法需要利用有監督的種子翻譯詞對來獲得兩個語言空間的映射。文章的主要思路是借助 GAN 這個工具。當然我們知道 GAN 存在訓練困難的問題,所以文章其實真正實現的是 WGAN。

關於文章的應用和意義,一方麵為許多跨語言處理任務提供了重要資源,尤其是為完全缺乏雙語資源的小語種和專門領域開辟了與其他語言連接的可能。此外,隻使用單語語料就能構建雙語詞典意味著語言在詞匯層麵的某種同態性,佐證了人類語言在概念表示上可能存在的一致性。

論文鏈接
https://www.paperweekly.site/papers/1087
代碼鏈接
https://nlp.csai.tsinghua.edu.cn/~zm/UBiLexEMD/


Ngram2vec: Learning Improved Word Representations from Ngram Co-occurrence Statistics
@paperhwd 推薦
2

本文主要還是想生成質量更好的詞向量,基於經典的 word2vec 的思想,在其之上加入了 ngram 的共現信息,取得了更好的結果。我更加在意的其實是他們提供了不錯的工具包,同時在建立共現矩陣的時候采取了優化策略來減少存儲開銷,加快了計算速度。

論文鏈接
https://www.paperweekly.site/papers/1086
代碼鏈接
https://github.com/zhezhaoa/ngram2vec/


Improved Neural Machine Translation with a Syntax-Aware Encoder and Decoder
@Andy 推薦
3

文章提出了 bidirectional tree encoder,可以同時學會譯出語言的序列表達和樹狀表達特征。之後,解碼器利用這些信息進行解碼。 其次,提出了 tree-coverage model,使得注意力機製更有效地利用了譯出語言的句法結構。

論文鏈接
https://www.paperweekly.site/papers/1082
代碼鏈接
https://github.com/howardchenhd/Syntax-awared-NMT/


A Simple Approach to Learn Polysemous Word Embeddings
@haimizhao 推薦
4

文章在原有的向量表示的基礎上,直接對上下文的向量表示作加權和,作為目標詞在該上下文的表示,方法極其簡單,可以低成本嚐試,一係列評估方法也自成一體。

論文鏈接
https://www.paperweekly.site/papers/1052
代碼鏈接
https://github.com/dingwc/multisense


Neural Paraphrase Generation with Stacked Residual LSTM Networks
@paperweekly 推薦
5

本文是第一篇用 deep learning 來做 paraphrase 生成任務的工作,已開源。

論文鏈接
https://www.paperweekly.site/papers/1034
代碼鏈接
https://github.com/iamaaditya/neural-paraphrase-generation


Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling
@applenob 推薦
6

基於 attention 的意圖識別 + 槽位填充 RNN 模型。

論文鏈接
https://www.paperweekly.site/papers/937
代碼鏈接
https://github.com/DSKSD/RNN-for-Joint-NLU
https://github.com/applenob/RNN-for-Joint-NLU

原文發布時間為:2017-11-10
本文作者:讓你更懂AI的
本文來自雲棲社區合作夥伴“PaperWeekly”,了解相關信息可以關注“PaperWeekly”微信公眾號

最後更新:2017-11-10 14:35:14

  上一篇:go  除了技術生態 國產處理器雄起關鍵靠資本
  下一篇:go  數據與架構:金融行業的智能化雲化探索與最佳實踐