閱讀597 返回首頁    go 技術社區[雲棲]


麥克阿瑟天才獎得主解碼計算機視覺“原罪”:AI 如何認識人類世界

日前,一係列令人著迷的圖像顯示了計算機在被輸入西方文學、哲學和曆史作品中的圖像和符號後,能夠“看到”的東西,這些內容簡直太令人熟悉——原來,人工智能裏有卡拉瓦喬,有維米爾、有弗朗西斯·培根、達利……如果你努力,甚至還能看到愛德華·霍普。

雖然看上去與古典大師作品十分類似,但這些奇怪而生動的場景並非出自人類大師之手。它們是我們未來的主人——人工智能算法的產物。而這些AI算法則出自藝術家Trevor Paglen之手,他上周剛剛獲得了50萬美元的麥克阿瑟“天才”獎。

計算機視覺中使用最廣泛的一張女性圖像,是《花花公子》的“11月小姐”

現年43歲Paglen認為,他的使命是聚焦我們周圍的數據交換、監控和自動化數據結構。他最近嚐試將相機對準世界的觀察者——各種監控攝像頭,Paglen深入了自動化係統的大腦,揭示了AI係統“眼中所見的事物”。

Paglen在紐約市Metro Pictures畫廊的新展覽,揭示了“雲的內部是什麼樣的?”“人工智能係統實際看到的世界是什麼樣的?”

image

“彗星”(由AI創作,它被訓練來識別與曆史上的預示、征兆有關的事物,例如彗星、日食、彩虹、黑貓、人臉形狀的雲)(Courtesy of Trevor Paglen and Metro Pictures, New York)

他的展覽項目,稱為“看不見的圖像的研究”(A Study of Invisible Images),顯示了研究人員用來訓練算法進行標注、分類的圖像,展現了AI是如何處理風景、臉部或手勢的,以及AI生成的巴洛克風格的藝術。

Paglen將AI訓練圖像集稱為計算機視覺的“亞當和夏娃”。這些圖像中包括了美軍在上世紀90年代開始收集整理的,麵部識別技術(FERET)計劃中的肖像,這是美軍用於教授計算機識別人臉的圖像,並成為此後計算機視覺研發的基礎。


image

美軍在上世紀90年代開始收集整理的,麵部識別技術(FERET)計劃中的肖像,最初是一個軍事計劃,後來成為計算機視覺研究的基礎。

計算機視覺已經廣泛應用於人們的生產和生活中,從在機場登記到監控工場生產管理。所有的這一切都始於像FERET這樣的訓練數據庫,而這裏庫裏的圖像標簽可能帶有少數研究人員無意識的偏見,還由可能來自於未經訓練的Mechanical Turk外包人員,以及實習生的偏見。

在去年發表在 New Inquiry上的一篇文章中,Paglen描述了CNN的識別誤差:

將印象派與寫實派大師馬奈的作品“Olympia”喂給在ImageNet訓練的CNN,這個CNN將這幅畫分類成立“卷餅”(burrito)。


image
馬奈的作品“Olympia”

或許,值得一提的還有計算機視覺中最著名的“夏娃”:Lenna,一名瑞典女性,其形象被《花花公子》雜誌撕毀,並於1972年被南加州大學的工程師掃描複原。後來《花花公子》雜誌授權,Lenna的形象獲得許可,出現在了世界各地的研究中,成為圖像處理測試的行業標準。自此,《花花公子》一張“11月小姐”的圖片已經成為計算機視覺研究中使用最廣泛的女性圖像之一。這也正是Paglen希望提醒公眾注意的“研究者選擇偏見”。


image

萊娜圖(局部):萊娜圖(Lenna)是指刊於1972年11月號《花花公子》上的一張裸體插圖照片的一部分,是一張大小為512x512像素的標準測試圖。該圖在數字視頻處理學習與研究中頗為知名,常被用作數字視頻處理各種實驗(例如數據壓縮和降噪)及科學出版物的例圖。

《IEEE圖像處理匯刊》(IEEE Transactions on Image Processing)的主編戴維·蒙森(David C. Munson),在1996年1月引用了兩個原因來說明萊娜圖在科研領域的流行:

“ 首先,該圖片很好的包含了平坦區域、陰影和紋理等細節,這些都有益於測試各種不同的圖像處理算法。它是一幅很好的測試照片!其次,由於這是一個非常有魅力女人的照片。因此,多數由男性組成圖像處理研究行業傾向於使用他們認為很有吸引力的圖片,也並不令人驚奇。

人臉檢測可能是計算機視覺中最令人擔憂的應用。今天,在廣泛使用的圖像處理數據庫ImageNet中,一些隨機的個人照片仍然被標記為“jezebel(譯注:耶洗別,《舊約聖經》中的負麵人物,以色列王國國王亞哈的王後,個性冷酷)”和“犯罪”,不知道在多少的時間裏默默地影響著分類和識別的結果。

“這到底是什麼?”Paglen說:“誰在發明這些類別,為什麼有這些類別,而沒有那些?是誰決定這些東西看起來是什麼樣的?

偏見是一種特征,不是bug

Paglen 的工作室有一個全職的程序員,以及其他工作人員。使用定製的平台“Chair”,工作室可以運行自己的計算機視覺測試,在新的數據集上訓練AI,並生成顯示出AI所學習的東西的圖像。Chair 應用了不同的機器視覺算法,包括 Caffe, Tensor Flow, Dlib, Eigenface, Deep Visualization Toolbox 和 Open CV。

在一個例子中,Paglen 對他的同事 Hito Steyerl 進行了麵部分析。數百張快照拍下了她的各種表情,包括做鬼臉、大笑、打哈欠、叫喊、憤怒、微笑等等。每一張照片都帶有 AI 對 Steyerl 的年齡、性別和情緒狀態的猜測。在一張照片中,她被評估為74%的可能是女性。

提出這樣一個複雜的問題可能是荒謬但卻簡單的:計算機是否應該嚐試測量存在不可分割的特征,例如性別、社會屬性、性格等——在沒有詢問它們的主題的情況下?(其次,100%的女性應該是什麼樣子的?)


image
機器可讀的 Hito, 2017. 來源:Trevor Paglen, “A Study of Invisible Images.”

AI視覺及其應用的這些盲區能被糾正嗎?

Paglen堅持認為,基於外表進行分類是一種根本上的危險行為。他說:“我認為,種族主義是機器學習的一個特征(feature)——而不是一個bug。”“這就是你想要做的事情:你試圖根據元數據標簽來區分不同的人,而種族就是一個最大的元數據標簽,你不會想要把它從係統中拿出來的。”

即使可以消除機器視覺在訓練過程中的偏見,你仍然會擔心計算機視覺在影響現實世界的過程中的不透明性。計算機已經越來越多地為你做決定,基於大量的訓練數據和圖像庫,而這些數據和圖像對於那些對機器視覺研究不了解的人來說基本上是不可得的。這可能很快就會使傳統的問責製度變得更加複雜:未來,在企業或執法機構中使用計算機視覺技術的人可能無法追溯AI是如何做出決定的,更不可能讓這一過程對消費者和公民透明。

Paglen 想警醒我們的正是這種看不見的過程,他寫了一些書,包括《盲點》(Blank Spots on the Map: The Dark Geography of the Pentagon’s Secret World)和《視而不見:分類中看不見的運算》(Invisible: Covert Operations and Classified Landscapes)。

AI 如何將人類概念繪製成圖:超現實主義審美,揭露你或許不曾留意的本質

在某種程度上,Paglen 當前的展覽中,AI生成的藝術部分還是相當“黑暗”的。

為了創建它,藝術家的團隊訓練AI來識別數據庫中的圖像。這些圖像主要是視覺隱喻或符號,代表了哲學,當代文化,文學和精神分析等主題。例如,用於訓練人工智能識別“吉兆”或“凶兆”的數據庫,包括彩虹和黑貓的圖像,而“美國的捕食者”數據庫包括北美當地的食肉動物和植物的圖像以及美國的圖像無人機,隱形轟炸機和Facebook創始人馬克·紮克伯格。

然後,AI被要求生成對這些概念進行描繪的草稿。Paglen說:“我們可以讓它畫出數以萬計的圖片,然後從中挑選出一些能引起我的共鳴的照片”,為機器人畫家扮演策展人角色的Paglen說。

最終的選擇是夢幻般的,總是有一點點融化的物體和朦朧的風景。Paglen說,美學並不是偶然的。 “有這樣一種哥特式,甚至是超現實主義的審美觀念。這實際上是非常有意思的,就像任何一個藝術家想要了解一些關於我們現在所處的當下和政治的時刻的東西。”


image
“死亡之路”(由AI創作,用第一次海灣戰爭後的照片訓練)


image
“一個男人”(由AI創作,訓練來識別人類和姿勢)

一個人工智能繪製的章魚看起來像介於一個石筍和失控的鰻魚之間的東西,漂浮在黑暗的水中。一張關於一個男人的照片,沒有臉,但是看起來卻很熟悉,說是弗朗西斯·培根的肖像也不為過。一個灰色的風景,名為“死亡高速公路”堪稱完美,“色情”的照片似乎捕捉了人類形體的一些本質。

我周圍的遊客開始將他們所看到的東西聯想到人類所創造的名畫。 “卡拉瓦喬,”有人低聲說。Paglen 鼓勵他們。 “這看起來很像維米爾,”他建議,指向一個名為Venus Flytrap的發光靜物。


image
“捕蠅草”(由AI創作,訓練來識別“美國掠食者”,包括食肉植物和動物,無人機,隱形轟炸機和馬克·紮克伯格)

Paglen選擇像呈現繪畫一樣呈現這些圖像,掛在深灰色的牆壁上,讓人想起著名藝術博物館的畫廊。Paglen說:“我正在思考圖像,視覺和人類看東西的曆史。”

“通過給它一點點的曆史審美,我可以更加堅定地找到它。在將後台和圖像組合在一起方麵,我非常清楚,這應該是一個混亂的Tate Britain的版本。

它很混亂。但是看起來還是令人驚訝。最後,結果與其他任何好的藝術對觀眾的影響是不一樣的:你以一種新的方式來看待圖像,並且欣賞它們可以為你做些什麼。

原文發布時間為:2017-10-23
作者:Caitlin Hu
編譯:文強,弗格森,劉小芹
本文來自雲棲社區合作夥伴新智元,了解相關信息可以關注“AI_era”微信公眾號
原文鏈接

最後更新:2017-10-23 15:34:42

  上一篇:go  Java並發控製機製詳解
  下一篇:go  如何準備Joomla3.8?