閱讀215 返回首頁    go 機器人


人工智能能騙過人類嗎?愚人節特寫:這不是玩笑

機器之心原創

作者:吳攀

人類自開始認識自己以來,大概就一直在夢想著能創造能與自己別無二致的存在(從偃師獻給周穆王的歌舞藝伎到弗蘭肯斯坦的怪物再到近段時間以來越來越栩栩如生的機器人和越來越智能的軟件程序),或者至少讓這樣的存在無法與其他人類被區分開。人類有能力辦到這一點嗎?還是說我們已經實現了這一目標,抑或是這僅僅隻是一個夢想而已?

時值愚人節,我們就來看看人工智能在「愚弄」人類上已經走了多遠了。

從圖靈測試說起

1950 年,圖靈發表了一篇劃時代的論文,文中預言了創造出具有真正智能的機器的可能性。由於注意到「智能」這一概念難以確切定義,他提出了著名的圖靈測試:如果一台機器能夠與人類展開對話(通過某種設備)而不能被人類辨別出其機器身份,那麼稱這台機器具有智能。這一簡化使得圖靈能夠令人信服地說明「思考的機器」是可能的。論文中還回答了對這一假說的各種常見質疑。圖靈測試是人工智能哲學方麵第一個嚴肅的提案。

圖靈測試:如果一個人(代號 C)使用測試對象皆理解的語言去詢問兩個他不能看見的對象任意一串問題。對象為:一個是正常思維的人(代號 B)、一個是機器(代號 A)。如果經過若幹詢問以後,C 不能得出實質的區別來分辨 A 與 B 的不同,則此機器 A 通過圖靈測試。(來自維基百科·圖靈測試)

但近些年來圖靈測試的有效性已經受到了很多的質疑,問題就在於圖靈測試太容易作弊了——通過欺騙或假裝無知便可以輕鬆通過測試。正如圖靈本人所預測的那樣,獲勝的主要訣竅是避而不答。比如說,如果一個裁判問一個機器,你有感覺嗎?機器必須撒謊才能通過測試。但是這種奇怪的扭曲不是特例,而是常態。通過圖靈測試的方法其實就隻能是欺騙。

研究者也在原始圖靈測試思想的基礎上提出了很多改進的版本或其它評價人工智能的方法,包括增加對更多種類的內容的理解或引入創造力測試等等;2015 年 io9 網站的一篇文章就盤點了其中 8 種有可能代替圖靈測試的方法,其中包括測試推理能力的 Winograd Schema Challenge、評價創造力的 Lovelace Test 2.0、評價結構能力的 Construction Challenge、判斷視覺能力的 Visual Turing Test……前段時間,心理學家和認知科學家 Gary Marcus 在《科學美國人》上也發文談到了一些新的人工智能智能測試方式,比如其中一種是人類的標準化測試:

人工智能將接受人類學生在小學、中學階段麵臨的考試,不給任何寬限。這一方法是將語義理解和解決各類問題的任務聯係在一起的絕妙方式。這很像是圖靈測試,但前者更加簡單直接。隻需讓人工智能接受嚴格的標準化測試(如紐約市四年級科學考試的多選題),為機器配備足夠的輸入能力(如自然語言理解和機器視覺模塊),然後開始考試吧。

那些或許通過了圖靈測試的軟件

盡管尋求替代的唿聲越來越大,但圖靈測試在很多人心中它仍然是智能技術前進的一大聖杯,而到目前為止,已經有一些研究者聲稱自己開發的軟件已經通過了圖靈測試。

最早的可能通過了圖靈測試的程序出現在 1966 年,那是著名計算機科學家 Joseph Weizenbaum 所開發的一個程序 ELIZA,其可以檢測用戶的輸入並尋找其中的關鍵詞。當找到了特定的關鍵詞後,該程序會根據一個規則給出了一個回應句子;而如果沒有找到任何可用的關鍵詞,那麼 ELIZA 會根據一種通用的方式用之前的一條評論來進行回應。據了解,Weizenbaum 還在 ELIZA 上複製了一種羅氏療法(Rogerian therapy)的行為,讓 ELIZA 可以自由地假裝對這個世界一無所知。通過這些技術和帶有欺騙性的技巧,ELIZA 成功讓一些人相信與他們的交談的是一個真正的人,甚至有評論說「很難相信 ELIZA 不是一個人類」。所以 ELIZA 大概是第一個通過了圖靈測試的程序吧。

與 ELIZA 的對話

1972 年,致力於計算機科學和人工智能在精神病學中的理論和應用的美國精神病學家 Kenneth Colby 創造了一個程序 PARRY,該程序也被稱為「有態度的 ELIZA(ELIZA with attitude)」。技術方麵和 Weizenbaum 所使用的方法類似,PARRY 試圖模仿妄想型精神分裂症患者的行為。在測試過程中,一組經驗豐富的精神病學家通過電傳打字機和 PARRY 與真實病人分別進行了對話,該對話的轉錄文本也被展示了另外的 33 位精神病學家。然後這兩組專家被要求判別哪些「病人」是人類,哪些又是計算機。但最終他們僅有 48% 的正確率,跟隨機亂猜差不多。這個程序大概也就此開創了通過裝瘋賣傻的方式愚弄人類的先河。

進入 21 世紀,更先進的技術和更強大的設備也帶來了更強大的欺騙方式。

2014 年,舉辦圖靈測試 2014 的英國雷丁大學宣稱俄羅斯人 Vladimir Veselov 開發的人工智能軟件 Eugene Goostman 通過了圖靈測試,這被很多人看作是一個裏程碑事件。據介紹,Eugene Goostman 軟件模仿的是一位 13 歲的男孩。在當年共有 5 台超級計算機參賽的圖靈測試競賽上,Eugene Goostman 設法讓受試者相信被測試者 33% 的答複為人類所為。而圖靈測試的通過標準為 30%,這意味著這台超級計算機通過了圖靈測試。

而在 2016 年,有研究者更是宣稱發現了讓任何軟件都可以通過圖靈測試的竅門:保持沉默。考文垂大學的研究者 Kevin Warwick 和 Huma Shah 通過論文《在圖靈的模仿遊戲中采用第五修正案(Taking the fifth amendment in Turing』s imitation game)》介紹了他們的發現:如果一台機器在測試中采用「第五修正案」,即在整個測試過程保持沉默,可以潛在地說它通過了該測試,並且可以因此將其視為一個有思想的存在。

但這些也許真的通過了圖靈測試的軟件真的就是智能了的嗎?我們可能無法認同。正如機器之心在文章《》中所總結的那樣,目前已經通過圖靈測試的軟件大都利用了四種欺騙性的技巧:

用短句短詞進行模棱兩可的回答。

根據裁判的社會習俗生活環境,進行相關處理。

對問題進行反問式確認,比如裁判問到"你是從俄羅斯來的嗎?",那麼反問策略則是「你為什麼不確定我是從俄羅斯來的?」。采用這種方式對抗裁判,往往是殺手鐧。這種反問式策略最初是心理谘詢上的治療手段,目前已被大量使用在圖靈測試的遊戲上。

當人類回答的過於詳細反而會被誤認為是機器,參賽者可以抓住這一點引導裁判進行詳細式提問,然後再進行模棱兩可式的回答,而這種情況下,真正人類回答的反而更機械更像機器了。

人工智能欺騙人類的能力越來越強

其實除了上麵提到了有些微妙的圖靈測試,人工智能技術在欺騙人類方麵實際上正在取得實實在在的進步。隨著近些年深度學習的興起和各種新型算法的出現,計算機在創造「以假亂真」的東西上已經取得了耀眼的成績,甚至很多時候就連最頂級人類造假者也會自歎弗如,畢竟機器不僅做得好,還做得快。下麵我們將介紹一些人工智能在生成無法與人類作品相區分的新作品上所取得的新進展,其中我們也會給出一些樣例,看你是否能夠分辨「真」與「假」。相關答案集中在文末公布,你能答對多少?

1. 誰在說話?

如果你對機器人說話聲音的認識還停留在一字一頓的階段,那你可能還沒嚐試過穀歌助手(Google Assistant),它流暢的語音輸出聽起來就像是一個訓練有素的《新聞聯播》英語播音員。但穀歌並不是唯一一個在語音合成上取得突破的公司或機構。去年 9 月時,DeepMind 表示他們最新的深度生成模型 WaveNet 將機器語音合成的表現與人類之間水平的差距至少縮減了 50%。今年 Yoshua Bengio 領導的一個研究團隊又提出了一種端到端語音合成技術 Char2Wav,可以學習直接根據文本生成音頻。此外,百度最近所提出的 Deep Voice 模型更是一個高速度的完全由深度神經網絡構建的高質量語音轉文本係統。也許很快我們就無法區分電話那頭的是人還是機器了。昨天,機器之心又報道了,該模型可接收字符的輸入,輸出相應的原始頻譜圖,然後將其提供給 Griffin-Lim 重建算法直接生成語音,實現了顯著的速度提升。

除了語音合成,機器也在努力學習其它類型的聲音合成。去年 6 月,MIT 計算機科學與人工智能實驗室的研究者報道了一種新的聲音模擬算法,並宣稱其真實程度能騙過人類。在他們的相關介紹中寫道:「最終這個算法能夠精確模擬不同撞擊的細微差別,從搖滾音樂斷開的音節,到常青藤搖晃時發出的沙沙聲。就連音高也不是問題,因為算法能合成的撞擊聲涵蓋了從軟沙發出的低音砰砰聲到硬木頭發出的高音哢噠聲。」在實際測試中,受試者選擇偽造聲音的次數是真實聲音的兩倍。尤其是樹葉、泥土這些聲音不清楚的材料上,他們更難以分辨,可謂是做到了「比真實更真實」。來感受一下:

擴展閱讀:

2. 聽,是誰在唱歌?

人工智能也在學習生成音樂,去年 5 月,穀歌研究科學家 Douglas Eck 向參加 Moogfest 藝術節的資深音樂迷們講述了其團隊通過訓練計算機來幫助音樂人編寫音樂的新成果——在一首歌中生成和弦、創造過渡和精心設計反複的旋律。他相信,總有一天,機器可以學會完全靠自己去寫一首歌。穀歌的這個項目名叫 Magenta,在 NIPS 2016 上還曾贏得了 Best Demo 獎。今年 4 月 18 日到 21 日,穀歌又將帶著該項目回到 Moogfest 藝術節,感興趣的讀者可以在(https://suo.im/2bFF2y)關注。下麵這段音樂可能就是 Magenta 創作的,你能分辨出來嗎?

音頻1

隨帶一提去年聖誕節多倫多大學的博士生楚航發布了一首完全由人工智能看著一棵聖誕樹來編曲,填詞創並朗誦的一首神奇的小調,並配有一個火柴人搖擺起舞。據介紹,楚航通過建立一個層級遞歸神經網絡(Hierarchy RNN)的模型,然後收錄大量音樂數據,從而由人工智能分析大體的音樂結構特點,發現並總結多首相似風格的音樂中存在的類似的特征,再以新穎的構建框架建立多層神經網絡模型,最終通過輸入一副畫麵,便能生成相應主題的流行音樂。在多層的構築框架下,還可以在生成音樂之外編出新穎的舞步和歌唱的人聲。

當然,上麵所提到的 WaveNet 和 MIT 的算法等也可以用來生成音樂。

擴展閱讀:

3. 風格遷移,偽造大師作品

自從照片處理應用 Prisma 一夜走紅之後,圖像風格遷移技術就從實驗室一下子飛入了尋常百姓家,讓即使「沒有藝術細胞」的人也能簡單動動手指據創造出美輪美奐的藝術作品。

去年 10 月,穀歌的一篇論文介紹了一種可以讓單個深度卷積風格遷移網絡同時學習多種風格的簡單方法,而且其不僅可以應用於靜態圖像,還可應用於視頻。11 月,Facebook 將這方麵的研究向前又推進了一步,在移動設備上實現了實時的風格遷移。

實際上,風格遷移(style transfer)並不是什麼新概念,有十幾年的曆史了,但利用神經網絡來做這件事還是最近由研究人員在發表於 2015 年 8 月的一篇題為《A Neural Algorithm for Artistic Style》的論文中引入的。而除了對照片的風格遷移,也有研究者將這項技術應用到了更多的領域,比如字體設計。在機器之心去年 11 月介紹的一個項目中,Flipboard 軟件工程師 Yuchen Tian 發布的 Rewrite 項目介紹了如何通過神經網絡學習設計漢字新字體的方法。

下麵是一張白宮的油畫和 Prisma 處理的一張白宮照片,你能分辨嗎?

圖 1

圖 2

擴展閱讀:

4. 機器詩人

用機器寫詩並不是什麼新思想,著名科幻小說《三體》係列的作者劉慈欣就曾經編寫過一個可以寫「現代詩」的程序「電子詩人」,不過這個僅有數百 KB 的小程序應該並沒有用到神經網絡,生成的作品可能格式比較工整,但卻往往缺乏中心思想。現在,有自然語言處理和自然語言理解技術幫助機器分析和理解語言,人工智能在寫詩的道路上也越走越遠。比如前段時間百度 NLP 在機器之心發布的專欄文章就解讀了百度在自動作詩方麵的研究進展。

創作詩歌對於人來說都很難,對於機器來說就更是難上加難了。據介紹,雖然機器與人相比,在一些方麵有著先天的優勢,例如,機器有無窮無盡的詞匯庫可供選擇,機器可以很容易的解決對仗、平仄和押韻等問題。但是,真正的詩歌是有靈魂的,詩歌本質上是在傳達詩人的思想。機器自動創作在主題控製方麵很弱,很難讓整首詩都圍繞一個統一的主題來生成。但機器有可能通過詩歌來說服人類,讓人感覺到它是有靈魂的嗎?

下麵這兩首詩歌,其中一首是計算機自動生成的,另一首是宋代詩人葛紹體寫的。你是否能猜出哪一首是計算機寫的,哪一首是詩人葛紹體所作呢?

擴展閱讀:

總結

在「欺騙人類」的道路上,人工智能正越走越遠。從語言合成到圖像生成再到模擬人類的對話,人工智能正在許多領域逼近甚至超越人類的表現水平。現在市麵上也已經出現了一些在一定程度上可以替代人類的伴侶式設備或聊天軟件。而伴隨著虛擬現實和技術、增強現實和混合現實等技術的日漸發展,未來的人工智能可能不僅能在圖像和聲音上偽裝成人類,甚至還能在更大的範圍內為我們創造一個足以以假亂真的世界——如果我們假設我們的世界是真實的話。

最後,答案揭曉:

實際上,音頻 1 是 Buck O'Nine 樂隊的《My Town》的片段,不是機器的作品,想感受 Magenta 的魅力,請在其擴展閱讀中查看 Magenta 相關文章。

圖 1 是由藝術家 Hall Groat II 創作的作品

圖 2 是機器之心小編用 Prisma 的 Caribbean 風格生成的圖片

詩 1「一夜秋涼雨濕衣」是計算機生成的詩歌

詩 2「荻花風裏桂花浮」為宋代詩人葛紹體所作,出自《東山詩文選》

本文為機器之心原創,轉載請聯係本公眾號獲得授權。

------------------------------------------------

最後更新:2017-10-08 02:47:35

  上一篇:go 特朗普的陰影下,人工智能將如何變革華爾街?
  下一篇:go BCG:人工智能重塑商業