通過SketchRNN、PCA和t-SNE從Google QuickDraw數據集中顯示矢量圖的潛在空間|附源碼

https://yq.aliyun.com/cloud

本文是作者最近發布的Google QuickDraw數據集一係列筆記中的第三部分，使用的最近發布的SketchRNN模型。下麵介紹QuickDraw數據集及SketchRNN模型。

QuickDraw數據集是由世界各地1500多萬人參與的“快速繪畫” AI實驗後收集數百萬幅圖畫建成，參與者要在20秒內繪製出屬於某個類（例如“貓”）的圖像。

2fe2089ec0ed5b84a527913712fa475ca9591aea

SketchRNN更是一個令人吃驚的生成模型，被訓練使用上述數據集生成矢量圖，它巧妙地集合了機器學習中最近開發的許多最新的工具和技術，例如Variational Autoencoders、HyperLSTMs（一個用於LSTM的HyperNetwork）、自回歸模型，Layer Normalization、Recurrent Dropout、Adam optimizer等。SketchRNN係統是由穀歌探究AI能否創作藝術的新項目的一部分，類似於教AI去繪畫，另外不僅僅是讓人工智能學習如何畫畫，還要能夠“用類似於人類的方式概括歸納抽象的概念”，比如去畫“豬”的廣義概念，而不是畫特定的動物，這顯然不是一件簡單的事情。

70a2d2c1d429e95023c9ba0b0674aa0373548164

本文的代碼丟棄了那些旨在解釋或演示的代碼塊，隻保留了運行實驗所需的代碼。“潛在空間中的主成分分析 ”部分的所有內容是直接從以前的博客中摘取。隨意跳過該部分，因為接下來是真正有趣的分析。這裏是第一篇和第二篇博客的鏈接，之前所講述的一切都是一些實用功能，以便於現在的可視化分析。
本文是筆記與代碼的結合，作者已經做出了風格以及其它一些細微的改變，以確保Python3能向前兼容。

1. 本文有點令人誤解，這是因為本文主要是探索Aaron Koblin羊市場（aaron-sheep）數據集，這是一個較小的輕量級數據集，以及一個手冊，演示了在這個數據集上已經預先訓練好的各種模型。由於該數據集模式與QuickDraw數據集相同，因此在此數據集上執行的實驗也不失一般性。

2. Magenta目前隻支持Python 2版本。

260a4122bad0cd267dd1ecc681f4616f03269718

接下來都是實驗的所需的python代碼：
在[2]中：

在[3]中

在[6]中：

獲得預訓練的模型和數據

在[7]中：

在[8]中：

輸出[8]：
'https://github.com/hardmaru/sketch-rnn-datasets/raw/master/aaron_sheep/'

在[9]中：

輸出[9]：'https://download.magenta.tensorflow.org/models/sketch_rnn.zip'

在[10]中：

INFO:tensorflow:Downloading pretrained models from https://download.magenta.tensorflow.org/models/sketch_rnn.zip...
INFO:tensorflow:Download complete.
INFO:tensorflow:Unzipping /tmp/sketch_rnn/models/sketch_rnn.zip...
INFO:tensorflow:Unzipping complete.

接下來讓我們看看aaron_sheep現在數據集訓練的規範化層模型。

在[11]中：

在[12]中：

在[13]中：

在[14]中：

加載預先訓練的模型

在[15]中：

INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = True.
INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = False.
INFO:tensorflow:Model using gpu.
INFO:tensorflow:Input dropout mode = False.
INFO:tensorflow:Output dropout mode = False.
INFO:tensorflow:Recurrent dropout mode = False.

在[16]中：

在[17]中：

INFO:tensorflow:Loading model /tmp/sketch_rnn/models/aaron_sheep/layer_norm/vector.
INFO:tensorflow:Restoring parameters from /tmp/sketch_rnn/models/aaron_sheep/layer_norm/vector

在[18]中：

在[19]中：

用主成分分析探索潛在空間

下麵，我們將測試集中的所有草圖編碼為學習到的128維潛在空間中的表示。

在[20]中：

輸出[20]：