創意對抗網絡(CANs)你知多少?
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
人類最難讓計算機做的事情之一就是創造性地思考。計算機非常善於從事人們精確指定的工作,並且完成的速度非常快。而創造力是一個抽象的概念,把給計算機賦予創造力已經被證明是機器學習方麵一個非常困難的的挑戰。
6月份,羅格斯大學的一篇研究論文介紹了全世界對創意對抗網絡(Creative Adversarial Networks,CANs)的想法。從上圖可以看出,他們訓練的CAN做了一件非常獨特的事情,創造出了一個看起來像是由真正藝術家製作的獨一無二的畫作,但卻又不是某件現存藝術品的簡單臨摹。
這些可能是機器創造性思維取得的最好成果。
CANs是具備創造性思維的GANs
CANs源於生成式對抗網絡(Generative Adversarial Networks, GANs),GANs是幾年前由Ian Goodfellow和他的同事創建出來的。要了解CANs,你得先了解GANs。
GANs是一種神經網絡,它由兩個神經網絡組成:發生器和鑒別器。
鑒別器的任務是將圖像作為輸入並確定它們是真實的還是偽造的(即由人類或由發生器創建的)。
發生器的任務是產生新的圖像,欺騙鑒別器讓它認為圖像是真實的。
通過向鑒別器饋送由真實圖像和發生器創作的偽造圖像組成的混合圖像,鑒別器學會了識別圖像真假的模式。同時,發生器獲得了有關哪些圖像最能欺騙鑒別器的反饋,以及如何改變自身的策略來更好地欺騙鑒別器。
鑒別器和發生器之間的競爭促使它們更好地完成各自的工作,而且如果GANs訓練正確的話,發生器輸出的結果看起來可能會出人意料的真實。
CANs的架構幾乎與GANs相同,但是通過一個關鍵的附加功能,發生器就可以進行創造性地“思考”了……
鑒別器不僅要學習如何區分每個圖像的真假,還要學習如何將圖像按25種藝術風格進行分類(例如:立體派、抽象、文藝複興、現實主義等)。
發生器不僅要欺騙鑒別器,讓它認為這些生成的圖像是真實的,還要讓鑒別器難以將這些圖像按25種藝術風格進行分類。
CANs是如何工作的?
為了理解為什麼將圖像按藝術風格進行分類這個功能能夠讓發生器創造性地思考,我們需要一個機器可以模仿的關於創造力的具體定義。
當一件藝術品是獨一無二,但又說不清無法判斷的時候,觀眾們就認為這是創造力。正是基於這樣的理論,激發了CANs的產生。我認為,羅格斯大學的研究人員在他們的論文中描述了這麼一種動態。
喚醒潛力太低,被認為是無聊;規避係統觸發得太多,則會導致負麵反應。
讓我們回過頭來想想這個與CANs的架構有什麼關係。通過獎勵發生器生成那些鑒別器無法按藝術風格進行分類的圖像,來迫使它生成獨特的(有創意的)圖像。同時,由於發生器仍然需要欺騙鑒別器讓其認為圖像是真實的,所以發生器不能生成明顯不同的圖像。
這樣,CANs就模擬出了我們如何看待藝術創造力這個定義。
藝術觀眾幾乎分辨不出差別
上麵這個表格比較了人類觀眾對四組藝術作品的評分。 DCGAN圖像由標準的GAN創建(無藝術風格分類,無法啟用創造性地思考)。這些圖像看起來很像真實的藝術品,但他們與預先定義的藝術風格很接近。他們不會創造性地思考。
CAN圖像集顯然是由創意對抗網絡生成的一組圖像。
抽象表現主義(Abstract Expressionist)和巴塞爾2016藝術展(Art Basel 2016)數據集都是現代藝術品的集合。抽象表現主義數據集由1945年至2007年間創建的圖像組成; “巴塞爾藝術展2016”則是在巴塞爾藝術展上展出的那些圖片,它是當代藝術展的旗艦。
令人印象深刻的是,來自CAN數據集的圖像在新奇、驚奇、歧義性和複雜性方麵的排名都最高。它們也更能欺騙觀眾認為這些是由人類創作的,而不是GAN生成的。
此外,CAN的創造者們認為,CAN和抽象表現主義圖像集之間另外一些或者大部分的差異是CAN創造性思維的結果。抽象表現主義數據集中的圖像對於藝術觀眾來說非常熟悉,因為它們很老,並且與預定義的藝術風格非常契合。但與巴塞爾2016藝術展的圖像集相比,藝術展上的圖像是人類最難區分真偽的。
你可以認為,人類發現巴塞爾2016藝術展的圖像集最難區分真偽的原因是因為這些圖片更有所謂的創造性。推而廣之,也許對於CAN來說,創建出讓人類難以區分真偽的圖像比創造某個熟悉的藝術風格的圖片更難。
無論如何,CANs都是在機器創造性思維方麵在藝術方麵的巨大突破。
如果你想閱讀羅格斯大學的這篇關於CAN的研究論文,可以在這裏找到。
文章原標題《What are Creative Adversarial Networks (CANs)》,作者:Zack Thoutt,譯者:夏天,審校:主題曲。
文章為簡譯,更為詳細的內容,請查看原文
最後更新:2017-10-09 10:34:08