特寫 | 人工智能背後的臨時工

用 10 周時間，讓你從 TensorFlow 基礎入門，到搭建 CNN、自編碼、RNN、GAN 等模型，並最終掌握開發的實戰技能。4 月線上開課，www.mooc.ai 現已開放預約。

雷鋒網按：我們都關注人工智能有多厲害，它們可以在圍棋、德州撲克和人臉識別上戰勝人類，但人工智能變得聰明，背後是海量數據的支撐，而且這些數據是需要標注的。因而隨著人工智能的繁榮，從事數據標注的人也越來越多。Wired 的這篇文章就介紹了穀歌如何雇傭人工標注 YouTube 視頻來訓練 AI。本文由雷鋒網編譯。

目前，Google 的 “廣告質量評估員” 已廣泛存在於全國各地。這些臨時雇員通常由外部機構代為聘請，其工作即是為 YouTube 視頻過濾暴力、敏感廣告信息。這一工作目前單憑電腦本身尚無法完成，Google 現在也似乎迫切需要這些人的幫助。

YouTube 每天都會出售數百萬條視頻廣告，廣告播出位置會由係統自動分配，所以廣告商往往不知道自己的廣告具體會在哪條視頻後播放。最近，這種 “不確定性” 令 Google 大為頭疼，公司甚至因此受到相關方的審查。

Google 方麵則一直積極解釋，以防止輿論擴大化。在他們看來，媒體其實誇大了視頻廣告問題，目前已標記的視頻數尚未達總數的千分之一，Google 首席營銷官 Philipp Schindler 也表示這個問題根本不足為訓。

由於 Google 超過 90 ％的收入都來源於廣告，因此他們也需要快速解決問題來防止廣告商撤位。但是，YouTube 每天都有近 60 萬小時的新視頻上傳量，如此巨大的數量使得采用人工過濾很困難，軟件所要處理完成的標記量可謂 “前所未有”。但問題是，公司仍然需要投入人力進行 AI 訓練。因此，Google 仍然依賴於人工完成廣告標記工作，以此構建好 AI 學習所需的數據。

評估員任務

技術公司會長期雇用內容管理員，這項工作也隨著人們上傳和分享量的增加而變得越來越重要。有廣告評估員說，他們的角色不僅僅在於監控視頻，他們會閱讀評論，標記用戶之間的濫用行為；會檢查 Google 提供的各種網站，確保符合公司標準；也會按類別進行網站分類，點擊廣告鏈接查看狀態正常與否。

具體而言，某些情況下評估員們需要在不到兩分鍾內查看幾小時長的影片，這就意味著這份工作更強調數量和速度。此外，他們也不僅隻是將視頻簡單標記為不合適——從標題到內容，他們都需要進行細致的評估並進行分類。存在評估內容與既定已有類別不匹配的情況時，他們會將材料標記為 “不可評估類”。

也多名廣告評估員說，公司要求他們觀看內容震撼的視頻，比如有人試圖在車上殺自己的狗——視頻中的人放火燒了自己的車，然後走出來以一槍結束了自己的生命。此外，還有人會看暴力侵害婦女兒童和動物的視頻。其實評價員們並不知道 Google 是如何進行視頻任務選取與下達的 - 他們隻有在開始工作的才能看到視頻的標題和縮略圖。

總而言之，Google 仍然需要人力來協助處理 YouTube 的廣告問題。公司高管和代表們也一再強調，隻有機器智能才能解決 YouTube 中的規模化任務問題，但是在 Google 機器或其他任何人都能夠自覺識別不宜言論之前，這樣的工作仍然需要依賴人去完成。

Google 發言人 Chi Hea Cho 說：“我們一直將技術與人類評論結合進行綜合分析已被標記的內容，因為對於視頻的理解是很主觀的。最近我們也增加人力加快評估速度，這些評論有助於我們完善算法很有幫助。”

評估員來源

據悉，廣告質量評估員這一工作開始於 2004 年。雇傭機構的始祖是 ABE，他們會付給大家每小時 20 美元的薪水，但是 2006 年 WorkForceLogic 收購了 ABE 之後，評估員工作條件就不如從前了。2012 年，一家名為 ZeroChaos 的公司收購 WorkForceLogic，如今則采取合同製方式進行人員雇傭。

廣告評估員可以隨時隨地工作，滿足每周 10 小時的最低工作要求即可。隻是這項工作不是那麼穩定，雖然大多數人都蠻喜歡這份工作，但他們幾乎沒有機會成為永久的全職員工。

本次調查的廣告評估員都是通過 ZeroChaos 聘用的，大家每小時賺取 15 美元，每周最多可以工作 29 個小時。如果每周工作時長達到 25 個小時，則可申請福利，但是想達到這個工作量可以說相當困難。有人說他們會麵臨毫無預兆就被解雇的情況，公司一封電子郵件，你們的勞務關係就終止了。

實際上由於無法與 Google 直接進行明確的溝通，評估者對這份工作會產生不安全感。穀歌隻會給評估員一個通用郵箱用於工作方麵的聯係，並且采用自動回複方式回答大家的郵件。也就是說，Google 會告訴評估員他們所做的工作相當重要，也會非常重視工作成果評估，但他們並不會給出詳細說明解釋原因。

Google 會將已審查的內容整合到廣告評估員的任務中用以績效衡量。這些測試內容會通過郵件的方式混雜在日常任務中一起發給評估員們，並以最終成績來評估大家的表現，沒有通過測試的人會麵臨解雇危險。

即使如此，每小時 15 美元的酬勞仍然高於大多數城市的最低工資。會有人很高興 ZeroChaos 給他的工作機會。

評估員與 AI

跨技術行業的大公司雇用臨時員工參加用於培訓 AI 係統的重複任務。一位廣告評估員曾在幾年前參與評估了 Microsoft Bing 的搜索結果，他們每人每小時要瀏覽多達 80 頁的搜索結果。LinkedIn 和 Facebook 也會通過進行類似的任務測試。

臨時性工作所帶來的安全感的缺乏和廣泛存在的短期合同工，使得現任和之前的雇員們感到不安，他們認為，Google 正在漸漸失去係統知識和經驗，這些東西原本為那些工作上投入了更多時間的雇員所掌握。他們花時間花時間訓練新人，接著又把他們掃地出門，實在是浪費時間。

但是，通過人類廣告評估員也許會找到能夠使 AI 更為聰明的最佳做法。AI 需要許多內容輸入，特別是一些令人反感的內容，所以定期輸入培訓人員數據更適合於訓練 AI。為機器輸入更為多元的信息，結果自然會更好。

另一方麵，AI 研究人員普遍認為，不良的人類習氣不一定會影響機器學習，反而可能會由於特別工作環境和經驗而產生更微妙的影響。康奈爾大學 AI 教授 Bart Selman 說：“人們通常的觀點是訓連 AI 模型需要大量的信息輸入。這種觀點適用於一般情況，但涉及道德判斷時，我們就要考慮到大多群體中會存在明顯的根深蒂固的偏見的，人們認為男性會比女性更好的勝任某些工作就是明證。所以，如果你是通過一般性或以往的信息輸入訓練 AI，那麼必然也會受這些信息中所隱藏偏見的影響。”

“你應該不想用那些普通人的日常做法來訓練 AI 的道德吧，那些對於潛在的偏見和倫理問題有著更為深入、仔細思考的想法才是你所想要的信息輸入。”Selman 說。

Google 員工在 Mountain View 總部享有絕佳的環境，而典型的廣告評估員的生活卻與之相差甚遠。為世界上最有價值的科技公司工作意味著享有優渥的福利和極高的薪水，但也可能意味著作為臨時工作者，你僅僅是在培訓這些公司的機器做同樣的工作。

via：wired

本文來源於"中國人工智能學會",原文發表時間" 2017-04-26 "

最後更新：2017-05-22 13:01:26

特寫 | 人工智能背後的臨時工

上一篇：靜態工廠方法VS構造器

下一篇： Kevin Kelly解讀人工智能狂熱：破解超人類人工智能的五個假設

相關內容

熱門內容

最新內容

特寫 | 人工智能背後的臨時工

上一篇： 靜態工廠方法VS構造器

下一篇： Kevin Kelly解讀人工智能狂熱：破解超人類人工智能的五個假設

相關內容

熱門內容

最新內容

上一篇：靜態工廠方法VS構造器