通过SketchRNN、PCA和t-SNE从Google QuickDraw数据集中显示矢量图的潜在空间|附源码

https://yq.aliyun.com/cloud

本文是作者最近发布的Google QuickDraw数据集一系列笔记中的第三部分，使用的最近发布的SketchRNN模型。下面介绍QuickDraw数据集及SketchRNN模型。

QuickDraw数据集是由世界各地1500多万人参与的“快速绘画” AI实验后收集数百万幅图画建成，参与者要在20秒内绘制出属于某个类（例如“猫”）的图像。

2fe2089ec0ed5b84a527913712fa475ca9591aea

SketchRNN更是一个令人吃惊的生成模型，被训练使用上述数据集生成矢量图，它巧妙地集合了机器学习中最近开发的许多最新的工具和技术，例如Variational Autoencoders、HyperLSTMs（一个用于LSTM的HyperNetwork）、自回归模型，Layer Normalization、Recurrent Dropout、Adam optimizer等。SketchRNN系统是由谷歌探究AI能否创作艺术的新项目的一部分，类似于教AI去绘画，另外不仅仅是让人工智能学习如何画画，还要能够“用类似于人类的方式概括归纳抽象的概念”，比如去画“猪”的广义概念，而不是画特定的动物，这显然不是一件简单的事情。

70a2d2c1d429e95023c9ba0b0674aa0373548164

本文的代码丢弃了那些旨在解释或演示的代码块，只保留了运行实验所需的代码。“潜在空间中的主成分分析 ”部分的所有内容是直接从以前的博客中摘取。随意跳过该部分，因为接下来是真正有趣的分析。这里是第一篇和第二篇博客的链接，之前所讲述的一切都是一些实用功能，以便于现在的可视化分析。
本文是笔记与代码的结合，作者已经做出了风格以及其它一些细微的改变，以确保Python3能向前兼容。

1. 本文有点令人误解，这是因为本文主要是探索Aaron Koblin羊市场（aaron-sheep）数据集，这是一个较小的轻量级数据集，以及一个手册，演示了在这个数据集上已经预先训练好的各种模型。由于该数据集模式与QuickDraw数据集相同，因此在此数据集上执行的实验也不失一般性。

2. Magenta目前只支持Python 2版本。

260a4122bad0cd267dd1ecc681f4616f03269718

接下来都是实验的所需的python代码：
在[2]中：

在[3]中

在[6]中：

获得预训练的模型和数据

在[7]中：

在[8]中：

输出[8]：
'https://github.com/hardmaru/sketch-rnn-datasets/raw/master/aaron_sheep/'

在[9]中：

输出[9]：'https://download.magenta.tensorflow.org/models/sketch_rnn.zip'

在[10]中：

INFO:tensorflow:Downloading pretrained models from https://download.magenta.tensorflow.org/models/sketch_rnn.zip...
INFO:tensorflow:Download complete.
INFO:tensorflow:Unzipping /tmp/sketch_rnn/models/sketch_rnn.zip...
INFO:tensorflow:Unzipping complete.

接下来让我们看看aaron_sheep现在数据集训练的规范化层模型。

在[11]中：

在[12]中：

在[13]中：

在[14]中：

加载预先训练的模型

在[15]中：

INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = True.
INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = False.
INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = False.

在[16]中：

在[17]中：

INFO:tensorflow:Loading model /tmp/sketch_rnn/models/aaron_sheep/layer_norm/vector.
INFO:tensorflow:Restoring parameters from /tmp/sketch_rnn/models/aaron_sheep/layer_norm/vector

在[18]中：

在[19]中：

用主成分分析探索潜在空间

下面，我们将测试集中的所有草图编码为学习到的128维潜在空间中的表示。

在[20]中：

输出[20]：