AI不可怕,就怕AI會畫畫——這裏有一種你還不知道的‘圖’靈測試…
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
0. 引言
有人說,阿爾法狗,So TM What?
還有人說,AI(人工智能)有什麼可怕的?它們不過是做一些人類不願做的髒活、累活和一些可批量重複操作的活計,而對一些帶有原創性質的活,比如藝術創作,AI就不靈光了。
喂,喂,喂,且慢,且慢,先進來看看這裏的‘圖’ 靈測試,再說。
目前我們所說的人工智能,在很大程度上,偏向於指基於深度神經網絡的機器學習(簡稱深度學習)。深度學習現在非常火,有點甚囂塵上,它的確也很爭氣,在諸多領域都有著很多驚人的表現。比如,它們在棋類博弈、計算機視覺、自動駕駛等領域,表現得跟人類一樣好,甚至更好。
但是,它能高效處理人類所有類型的知識嗎?人們不禁要問。
1. 人類知識的4個象限
有人做過分類,說人類的知識在兩個維度上可分成四類(見下圖)。即從可統計與否上來看,可分為:是可統計的和不可統計的。從能否推理上看,可分為可證明(可推理)的和不可證明(不可推理)的。
在橫向方向上,對於可推理的,我們都可以通過機器學習的方法,最終可以完成這個推理。對於可推理的,且可統計的知識(象限1),早已不在計算機話下。人們正試圖找到可舉一反三的機器學習方法,向可推理但不可統計的象限進發(象限2)。目前,還有很多傳統的機器學習研究者,正是力圖在這個方向作出一些成就,但整體上,研究進展還是乏善可陳,不溫不火。
而在縱向上,凡是可統計的、但不可推理的(即第3象限),都可以通過(大)數據和深度學習的辦法,可得到一個比較好的結果。例如,目前的深度學習,其實都是在第3象限,提交了非常耀眼的成績單。
但是,還有一個第4象限呢?
有哲學家說,我們把計算機能完成的(第1、2、3現象),都“外包”給計算機了,而第4象限還是留給我們人類自己玩吧,因為它不可統計,也不可推理,隻能靠我們人類自己的頓悟,來開拓新知的邊界,比如說提出新理論,比如說創作新藝術什麼的。
可是,就有人不同意這個觀點,於是一波人就聚一起,組織一個會議,大家一起來撕撕,辯一辯。有道是“油燈越挑越亮,真理越辯越明”嘛。
2. 一場別樣的‘圖’靈測試
圓桌會議由穀歌技術大神Mordvintsev主持。他說,大家先來看看這幅畫,我們且稱之為A吧,大家有誰知道A畫屬於哪家畫派?
會場上竊竊私語:“這不就是梵高的名作《星夜》(The Starry Night)嗎?”
“沒錯!”Mordvintsev接著說,“這就是梵老的後印象主義代表作。”
“那麼,請問各位,對於這樣的藝術創作,具有可推理性嗎?” Mordvintsev問道。
眾人答:“沒有吧。”
“那麼,再問各位,這樣的藝術創作,具有可統計性嗎?” Mordvintsev接著問道。
眾人答:“也沒有吧,藝術哪有什麼規律可循呢?”。
Mordvintsev又說:“請大家接著看下麵一幅畫,暫且稱之為B吧。”
“且不說,B畫價值幾何?請問B屬於什麼畫派?”Mordvintsev又問。
眾人答:“這畫看起來挺瘮人的,人不人,馬不馬的,此畫的作者應該是和梵高屬於一類人——後印象主義吧?”
Mordvintsev:“Bingo!答對了!謝謝各位讓我們通過‘圖’靈測試!”
眾人:“你大爺的,這哪跟哪啊?欺負我們不懂什麼叫圖靈測試嗎?”
Mordvintsev一臉壞笑:“各位息怒啊,且聽我解釋。你們看到是不是都是圖啊?這個測試也挺靈吧,所以我們就叫‘圖’靈測試。”
眾人一片嬉笑與嘩然:“籲——”
Mordvintsev接著說:“大家看啊,A是人類畫出來的。而B是我們穀歌用電腦畫出來的(學名叫Inceptionism,且稱為“盜夢主義”吧[1]),而現在,你們並沒有明顯地區分出來A和B的畫風和流派有何不同,我們姑且大致認為,A和B是一個流派吧,而現在作為藝術創作的A,大家都認為它具有不可推理性、不可有可統計性。很自然,B也就具備A的所有特性(A、B不分家嘛),而B是由計算機搞出來的。因此,計算機也具備解決不可推理且不可統計問題(即人類知識的第四象限問題)的能力。
眾人:“你丫這坑挖的,解釋可有點牽強哦!”
Mordvintsev哈哈大笑:“的確,但至少我們撬開了這扇門的門縫吧”。
眾人:“是啊,細思極恐。”
AI不可怕,就怕AI會畫畫。
(以上會議,純屬虛構,如有雷同,請對號入座)
3. “深度風格”是怎樣的一種畫風?
如果說Mordvintsev的“盜夢主義”,還處於實驗室階段的話,那麼David Aslan正在使用的“深度風格(Deep Style)”[2],則是一種非常實用的、基於神經網絡的藝術畫風。
Aslan是一名法國人,作為一位小有成就的用戶體驗設計師(UX Designer),對藝術創作,特別是計算機藝術創作,他有自己獨到的見解。在他看來,“深度風格”並不是一個簡單的、類似於如PhotoShop(PS)的圖片處理工具,它要比PS智能得多。因為它畫出來的畫,更具有欺騙性(更像專業畫家畫的!)。以前,人們總是以為計算機不會取代諸如藝術創作之類的工作,而現在,人們的信心開始動搖了。
有圖有真相,下圖就是Aslan利用“深度風格”工具繪製的一幅畫,可以看出,畫麵七彩斑斕,畫風詭異清新,充滿著藝術範。
如果諸如“畫風”這類創作藝術範的東西,都能被計算機所“創造”的話,那麼,Aslan個人所做的那些鍵盤敲擊、鼠標按壓等操作,計算機還能模仿不出來嗎?
對於計算機創作藝術,我們不禁感歎:春天都到了,夏天還會遠嗎?
(下圖右上為原圖為好萊塢明星Brad Pitt(布拉德·皮特)的肖像,下圖輸出的就是畢加索風格的畫像[3])
小福利
如果你對這類基於神經網絡的繪畫藝術感興趣,不妨找來相關的APP感性地牛刀小試一把,一鍵就能輸出你所期望的畫風Stytle!(在GitHub下載neural-style,Linux平台安裝)。
參考文獻:
[1] Alexander Mordvintsev, Christopher Olah, Mike Tyka.
Inceptionism: Going Deeper into Neural Networks (要翻牆)
[2] David Aslan. How Artists Can Use Neural Networks to Make Art
[3] Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge. neural-style
本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯整理。
文章作者:張玉宏(著有《品味大數據》一書),審校:我是主題曲哥哥。
最後更新:2017-04-23 16:31:41