开源代码“All in One”:6 份最新「Paper + Code」等你复现 | PaperDaily #12
[ 自然语言处理 ]
Earth Mover’s Distance Minimization for Unsupervised Bilingual Lexicon Induction
@paperhwd 推荐
文章想解决的问题是如何使用无监督的方法构建双语词典,传统方法需要利用有监督的种子翻译词对来获得两个语言空间的映射。文章的主要思路是借助 GAN 这个工具。当然我们知道 GAN 存在训练困难的问题,所以文章其实真正实现的是 WGAN。
关于文章的应用和意义,一方面为许多跨语言处理任务提供了重要资源,尤其是为完全缺乏双语资源的小语种和专门领域开辟了与其他语言连接的可能。此外,只使用单语语料就能构建双语词典意味着语言在词汇层面的某种同态性,佐证了人类语言在概念表示上可能存在的一致性。
论文链接
https://www.paperweekly.site/papers/1087
代码链接
https://nlp.csai.tsinghua.edu.cn/~zm/UBiLexEMD/
Ngram2vec: Learning Improved Word Representations from Ngram Co-occurrence Statistics
@paperhwd 推荐
本文主要还是想生成质量更好的词向量,基于经典的 word2vec 的思想,在其之上加入了 ngram 的共现信息,取得了更好的结果。我更加在意的其实是他们提供了不错的工具包,同时在建立共现矩阵的时候采取了优化策略来减少存储开销,加快了计算速度。
论文链接
https://www.paperweekly.site/papers/1086
代码链接
https://github.com/zhezhaoa/ngram2vec/
Improved Neural Machine Translation with a Syntax-Aware Encoder and Decoder
@Andy 推荐
文章提出了 bidirectional tree encoder,可以同时学会译出语言的序列表达和树状表达特征。之后,解码器利用这些信息进行解码。 其次,提出了 tree-coverage model,使得注意力机制更有效地利用了译出语言的句法结构。
论文链接
https://www.paperweekly.site/papers/1082
代码链接
https://github.com/howardchenhd/Syntax-awared-NMT/
A Simple Approach to Learn Polysemous Word Embeddings
@haimizhao 推荐
文章在原有的向量表示的基础上,直接对上下文的向量表示作加权和,作为目标词在该上下文的表示,方法极其简单,可以低成本尝试,一系列评估方法也自成一体。
论文链接
https://www.paperweekly.site/papers/1052
代码链接
https://github.com/dingwc/multisense
Neural Paraphrase Generation with Stacked Residual LSTM Networks
@paperweekly 推荐
本文是第一篇用 deep learning 来做 paraphrase 生成任务的工作,已开源。
论文链接
https://www.paperweekly.site/papers/1034
代码链接
https://github.com/iamaaditya/neural-paraphrase-generation
Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling
@applenob 推荐
基于 attention 的意图识别 + 槽位填充 RNN 模型。
论文链接
https://www.paperweekly.site/papers/937
代码链接
https://github.com/DSKSD/RNN-for-Joint-NLU
https://github.com/applenob/RNN-for-Joint-NLU
原文发布时间为:2017-11-10
本文作者:让你更懂AI的
本文来自云栖社区合作伙伴“PaperWeekly”,了解相关信息可以关注“PaperWeekly”微信公众号
最后更新:2017-11-10 14:35:14