神經網絡中的造物者-GANs
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
當一個小孩畫一隻貓的時候,你會更加了解這個孩子,而不是了解畫出來的貓。同理,我們使用神經網絡生成圖像能幫助我們理解神經網絡是如何對輸入的信息進行處理的。通常,人們很難以直觀的方式解釋神經網絡的功能,但是生成算法提供了一種使神經網絡解釋自己的方法。
神經網絡常被用作實現一個圖像分類器,能夠用它來區分圖像中是貓還是狗,或者識別消防標誌等。不過,在過去的三年中,研究人員從本質上對這些神經網絡進行逆轉,並且取得了驚人的進展。隻需要使用簡單的生成算法,就可以通過大量的圖像數據進行訓練,然後生成類似於訓練圖像的全新圖像。具有創造力的AI已經證明:表麵上看,它們在模仿人類的創造力方麵已經做的非常出色。
目前的生成AI研究浪潮建立在生成對抗網絡(GAN)的基礎上,GAN是一種由Ian Goodfellow和他的同事在2014年提出的一種神經網絡結構。隨著Ian Goodfellow論文的發表,一係列的發明應用隨之而來。研究人員使用GAN網絡可以生成從人臉到臥室的一切圖像。通過一項基於GAN叫做pix2pix的技術,可以直接通過衛星圖像生成地圖,可以為黑白照片自動填色,可以將手繪的草圖渲染成逼真的實景。增強低分辨率而且模煳的監控圖像隻是一個非常模煳的幻想,不過現在已經通過使用GANs成為現實,現在GANs已經可以對低分辨率照片中可能的結構做出複雜的設想了。
圖1 由神經網絡生成的雜誌封麵
一個生成對抗網絡由兩個神經網絡組成:一個學習產生某種數據(如圖像)的生成器,一個學習判斷生成器產生的數據與現實世界數據相比是真還是假的判決器。生成器和判決器具有相反的訓練目標:判決器的目標為區分“真實”數據和假數據,而生成器的目標是生成判決器無法判定為假數據的假數據。是不是感覺非常有意思?
Jon Bruner 和 Adit Deshpande 基於TensorFlow演示了一個非常簡單的生成對抗網絡,這個網絡創造出了逼真的手寫數字圖像。圖2為該網絡的學習過程,從隨機噪聲開始,出現了一種原始智慧:首先神經網絡反複產生相同的通用偽數字,然後領會不同數字之前的差異,最終可以創造每一個數字。
圖2 生成器經過訓練後生成手寫數字的過程動畫演示
神經網絡善於通過豐富的數據進行簡單的推斷,神經網絡通過多層神經元能夠自我組織並在多層次檢測從紋理片段到基本結構的模式,並且它能夠挖掘到人們可能會錯過的模式。這就是神經網絡的優勢,不過也是解釋它比較困難的根源。神經網絡雖然能夠注意到人們無法注意到的模式,但是如果的網絡結構過於簡單或者訓練數據不足以表示真實世界的變化,他們也會像人一樣進行不合理的探索。
像多元線性回歸這種簡單的統計模型,是很容易解釋它的原理的,這種函數足夠直觀,大家可以一目了然的掌握它的原理。但是對於具有多層神經網絡就沒有這麼直觀了,多層神經網絡通過訓練集進行自由的自我組織,並且不同層次神經元之間相互關聯,這種連接方式導致每一層神經元的功能變得模煳,我們就不得而知每層神經元究竟對應什麼功能。
這個簡單的生成對抗網絡確實像人類一樣進行推理。當你看一張貓的照片時,你能明確地識別出你認為這是一隻貓的每一個證據嗎?你通過快速的觀察得到各種特征:貓的耳朵,貓的胡須,貓的毛發樣式等,總的來說,通過這些特征你最終得到這是一隻貓的結論,神經網絡亦是如此。
正是因為GAN中的生成器具有多層次處理信息的能力,所以該網絡重構信息後輸出的結果比較真實。圖3是通過GAN生成的臥室圖片,不得不說效果相當棒。不僅床單,地毯和窗戶看著很真實,而且他們的位置也是正確的,床單放在床上,地毯鋪在地上,窗戶開在牆上。
圖3 GAN生成的臥室圖像
如果你接觸過圖像識別,你可能會對卷積神經元比較熟悉,卷積神經元可以跨圖像掃描並過濾像素進行模式檢測。卷積層通常將圖像縮小,但是在GAN的生成器中,卷積層的功能被逆轉,以便按比例擴大數據。
生成器不是用來檢測模式和匹配圖像中的特征的,而是使用反卷積的方式生成基本圖像構建塊,並且再將這些基本構建塊組裝融合成“真實的圖像”。比如,這個簡單的GAN生成了一個非常“真實的”數字9,如圖4所示。
圖4 GAN生成非常“真實”的手寫數字9
通過觀察反卷積濾波器和其對應的輸出,可以發現這些由最後一層反卷積層生成的構建塊來自圖4中的手寫數字9。
圖5 第2、3層反卷積濾波器及其輸出(生成數字9時)
GANs才三歲而已,顯而易見,GANs在不久的將來會被用作生成各種內容,甚至可能在每個用戶訪問網站的過程中為其定製圖片或者視頻。當GANs作為一種創造性力量出現時,去細細體會它的推理方式吧。
還在等什麼?快快動手去嚐試建立你自己的GANs吧!
作者介紹:Jon Bruner, 程序員,記者。曾任福布斯雜誌數據編輯,專注於研究軟件世界與物理世界之間的共同點。
以上為譯文
本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。
文章原標題《Finding meaning in generative adversarial networks》,作者:Jon Bruner,譯者:坯子,審校:。
文章為簡譯,更為詳細的內容,請查看原文
最後更新:2017-09-16 17:03:15