Ian Goodfellow回憶GAN誕生故事:幾杯啤酒喝出“20年來最酷的深度學習想法”
當Ian Goodfellow解釋他在穀歌大腦所做的研究時,他引用了原子物理學家、加州理工學院教授兼暢銷書作家的這句格言。但是,Goodfellow不是指自己,也不是Google內的任何其他人。他談論的,是機器:“AI不能創造的,便是它不明白的(What an AI cannot create, it does not understand)”。
Ian Goodfellow在推特上轉發這篇文章:
關於GAN的誕生往事
Goodfellow是世界上最重要的AI研究人員之一,在Elon Musk和Sam Altman建立的穀歌大腦競逐對手OpenAI短暫工作後,他返回穀歌,建立了一個新的研究小組,探索“生成模型”——一個可以創造現實世界的照片,聲音和其他表征的係統。 Goodfellow引用Feynman的名言,將這一努力描述成通往各種人工智能的重要途徑。
他解釋說:“如果AI能學習如何想象現實的圖像和逼真的聲音——這將鼓勵AI了解世界的實際結構。它可以幫助AI理解它看到的圖像或它聽到的聲音。”
幾杯啤酒後誕生的
“20年來最酷的深度學習思想” GAN
▼
2014年,當時還在蒙特利爾大學讀博士的Goodfellow,在一家酒吧微醺後,想到了一種稱為“生成對抗網絡(generative adversarial networks)”或GAN的AI技術。盡管這個想法來自幾罐啤酒,其仍不失為一個非常優雅的設計:一個AI嚐試創造它認為真實的圖像,而第二個AI分析結果,並嚐試確定圖像是真實還是假的。 Goodfellow說:“你可以把它們當作藝術家和藝術評論家,生成模型想要愚弄藝術評論家 ——讓藝術批評家把它所產生的圖像當成真的”。因為第二個AI努力地識別造出來的假圖像,所以第一個AI得以學會模仿真實世界。這種方式,是一個單獨的AI無法完成的,。在這個過程中,這兩個神經網絡可以將AI推向某一天,電腦宣布獨立於他們的人類老師。
監管Facebook人工智能研究的Yann LeCun將GAN稱為“過去20年來最酷的深度學習思想”。深度學習是一種AI,它正在改變所有互聯網最大的公司的方向,包括穀歌,微軟,和亞馬遜,以及Facebook。 Goodfellow的想法還在不斷發展,但它們已經快速傳遍AI社區。許多研究人員,包括LeCun,相信他們可以導致“無監督學習”,這是AI研究領域的巨大願望:機器學習無需人類的直接幫助。
做正確的事
▼
Goodfellow得到這個靈感時,是位於蒙特利爾酒吧名為Les 3 Brasseurs,或“三個釀酒師”的酒吧。他的朋友Razvan Pascanu,現在是Google的另一個AI實驗室DeepMind的研究員,彼時剛完成了他的博士學習,很多朋友聚集一堂送別他。其中一個正在描述一個新的研究項目,試圖用數學方法確定進入照片的所有內容。這個想法是將這些統計信息輸入一台機器,以便它可以自己創建照片。半醉中,Goodfellow說這是永遠不會有效的 —— 要考慮的統計量太多,沒有人能全部記錄下來。就在這一刻,他想到了一個更好的方法:神經網絡可以教會機器如何建立逼真的照片。
神經網絡是一種比較複雜的數學思維,它通過識別照片中的人臉和口語理解分析大量數據來進行學習任務。
在酒吧裏,Goodfellow決定使用現實的照片來構建神經網絡學習,然後可以與其他進行對比,來試圖辨別照片是否為假,實際上,這一切是依據它們第一次的感覺來判斷。
他表示通過這種方式,它最終可以成為第一個使用神經網絡生成並與真實事物無法分辨的虛假圖像。
爭議隨之而來,Goodfellow的朋友們堅持認為這種方法行不通。所以當他晚上到家的時候,他開始進行這項試驗。“當我回家的時候我有點喝醉了,我的女朋友也已經熟睡了。”
我坐著那兒思考:酒吧裏我的朋友們他們都想錯了!他回憶著說,當時我連夜在筆記本電腦裏完成了GANs的代碼。
按照他的說法,程序代碼第一次測試就正常運行了。“這是真的,真的很幸運,”他說道,“如果不是因為第一次代碼就成功,我可能已經放棄這個想法了。”
他和其他的一些研究人員在那年晚些時候發表了一篇論文,闡述了這個想法。在那之後的三年,已經有數百篇論文來探討這一概念。
更智能的AI
也許不再需要人類
▼
在第一篇論文中表示,這兩種神經網絡可以產生一種能夠生成手寫數字的現實圖像的係統。
如今,研究人員正將這個想法在從貓到火山再到整個星係的各種照片上應用。
它甚至可以幫助進行天文學試驗和模擬粒子物理學試驗。但這仍然是一件非常困難的事情,它不僅需要訓練一個神經網絡,還需要兩個神經網絡同時運行。
在穀歌,他成立了一個專注於GANS和相關研究的新團隊,Goodfellow希望能優化這一過程,他表示道:“最重要的是,作為一名機器學習研究者,我得不斷對它們進行有效的訓練。”
最終的結果:神經網絡係統不僅能夠更好地生成圖像與聲音,還能識別它們,這是一種能夠在人類的輔助下獲得更多的信息的係統。係統模型會嚐試學習並理解世界的構造。Goodfellow表示道:可以幫助係統在沒有明確背景信息的情況下盡可能多的學習。
GANs甚至可能達到一項迄今未能實現的目標,即在無人監管的情況下自主學習。目前,神經網絡可以通過分析上百萬幅貓的圖片學會對其進行識別,在此過程中,人類必須仔細對這些圖片進行分析並進行標注。目前,人類仍在機器學習中不可或缺,而隨之帶來的個人偏見和對大量人類勞動的需求,常常正是AI訓練的問題所在。諸如LeCun等AI研究學者正著力推動可顯著加速AI發展進化,無須大量人類參與的學習係統研究。
然而這僅僅是開始。GANs將帶來許多其他可能。David Kale,南加州大學的AI研究學者,相信這個創意可以幫助他和他的同事在不侵犯患者隱私的情況下來建立一個健康護理AI。機器學習係統可以基於假想數據替代真實數據進行訓練。“比起把病人病曆大規模上傳到網絡供人使用,為什麼不創造一個向研究者開放的完全虛擬數據庫以訓練GANs呢?”Kale說,“如果基於該數據庫的訓練模型和原始數據訓練結果毫無差異,我們又何樂而不為呢?”
原文發布時間為:2017-04-12
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
最後更新:2017-05-17 13:34:22