114
機器人
人工智能鑒黃準確率已逾99%,內容審核交給機器來做原來這麼穩
“潮水終有退去的時候,但是隨之而來的是更為洶湧的潮水。”這就是2017年互聯網給人的第一印象。直播百團大戰的局麵終於回歸了平靜,在銳減近六成平台後,平靜的局麵變成頭部平台在這個紅利期已過的行業圍繞內容和社交這兩個焦點,各顯神通慘烈廝殺。直播的潮落對應的是短視頻的崛起,在以內容為王的口號引領下,這個2017年新流量入口揮手告別草莽時代,終於看到了一條陽關大道,裹挾著一輪一輪融資、估值、IPO,在資本的助推下占到了互聯網的風口浪尖上,開始在短視頻創業潮中狂飆突進,殊不知內容裏的暗礁即將讓所有人都麵臨當頭一棒。
成也內容、敗也內容
所有以內容為主旋律的互聯網項目敲響警鍾的,是最近一次著名的“K12領域競爭”,小猿搜題與百度作業幫互懟,爭執不休。孰是孰非在法律宣判沒有來臨前我們可以暫且放下,但是在“內容”對所有行業發展的愈來愈重要的今天,高效審核製度的建立我們卻等不了了。大量的不良信息充斥於各種平台、營運、社區、遊戲,甚至於不良信息可以稱為“競爭”的籌碼打壓自己的競品,都是最直觀的體現。甚至於互聯網公司標杆的facebook,都不得不新增了3000名負責內容審核的員工,用人海戰術來杜絕泛濫於平台上的各種不良信息,避免再次遭受色情、暴力、犯罪這些不良內容對其品牌以及用戶的損害。
最先感受到不良內容對其發展造成阻礙的應該是直播平台。2016年,政府出台了一係列法律法規直至色情內容泛濫的直播平台,《信息網絡傳播視聽節目許可證》以及「雙資質」的要求讓靠“色情”等不良內容吸睛而野蠻生長的直播平台直接被腰斬,大批不具備監管部門所要求的牌照的公司岌岌可危,數十家平台一夜人去樓空。不僅如此,各種短視頻、視頻平台也受到了波及,各種影視作品下架無數。最近,各大新聞資訊平台、自媒體也沒能幸免,紛紛因內容審核不過關,違反《網絡安全法》被立案調查,並責令其限期整改,互聯網內容創業局麵之慘讓人不經感歎成也內容,敗也內容。
內容審核的尷尬局麵
事實上內容審核一直都有,互聯網最早的內容審核方向主要集中在涉黃問題上,最初的審核精度讓人不忍直視,隻要圖片中有黃色,便會被認定為涉黃;第二代的內容審核方式便是當年被人詬病無數的“綠壩”,這款旨在避免青少年受互聯網不良信息影響和毒害的軟件識別精度雖然上升了,但是準確率還是不盡人如意,簡單的“中指”照片,或者任何“棍狀物”都會被其識別為涉黃內容,在經曆了2年多的發展後,綠壩還一度傳出“因項目組經費緊張或遭遣散”的傳聞。
互聯網不良信息過濾、內容審核的尷尬終於隨著互聯網技術的發展而迎來了可能的解決辦法,那就是人工智能;2016年網信辦發布的《未成年人網絡保護條例》明確鼓勵並支持研發、生產和推廣為成年人上網保護軟件。技術發展再加上政策支持,內容審核技術的發展終於迎來了春天。
三國鼎立的人工智能審核時代
人工智能的內容審核方式是讓機器在海量的圖像、文本、視頻數據下深度學習,不斷提升係統對於各種類型內容的識別數量和判斷精度,概括而言就是將深度學習應用於計算機視覺與圖像的技術。截止到目前為止,國內人工智能產業中,以「計算機視覺與圖像」作為核心技術發的公司數量已高達上百家,而細分到“不良信息過濾”這個環節上,可以與商業場景緊密結合,並在識別“色情”、“暴恐”、“時政敏感信息”、“小廣告”等違規圖片和視頻方麵有領先優勢的國內出名的企業呈三國鼎立局麵,這三家平台分別是優圖、圖譜和數峰。圍繞內容在“色情”內容方麵的尷尬局麵,經過三次深度測試後,筆者請專業的評測人員對比三家平台在“鑒黃”方麵能力進行了比較,這次測試準備了三個測試集共20000張照片樣本,就圖片的普通、性感、色情結果來看,三家平台在鑒黃的能力方麵各有優勢。
測試結果顯示,優圖:準確率87.75%,三項數據普普通通,如果給其鑒黃能力一個定位的話,那就是無英華可以自見,無名譽可以震俗的劉備;圖譜:準確率76.96%,雖然色情圖片識別率驚人,但是其他數據表現差勁,其定位應該是寧可錯殺三千不放過一個漏網之魚的曹操;至於準確率高達93.13%,並且有兩項數據均高於圖譜和優圖的數峰,其定位便是談笑間檣櫓灰飛煙滅的周瑜,數據全麵占優。雖然鑒黃服務在數據表現方麵的表現已經有了商業應用的可能,但是國內人工智能在內容審核、不良信息過濾方麵的能力還說有很大的上升空間的。內容作為互聯網應用或平台將來的發力方向,對各行各業都有至關重要的地位,引入更好的審核機製,從而建立健康的內容環境,在不良信息大行其道,甚至可能會成為競品構陷自己的手段的今天已經是迫在眉睫,這也要求不良信息過濾技術需要更高的精度來滿足其需求。
K12領域小猿搜題和百度作業幫之爭背後在筆者看來最需要關注的是內容監管失責的問題。拋開這些,小猿搜題和百度作業幫在在線教育人工智能應用方麵還是有突出表現的,作為人工智能最為重要的深度學習技術,小猿搜題將其應用於批改英語,百度作業幫將其應用於水平測試。他們都看到了人工智能對在線教育的良性促進作用,但是卻沒有用它們來幫助自己在內容監管方麵作出更多的良性促進作用。技術應用除了助人也要幫己,加強人工智能對不良信息的過濾,讓不良信息諸如“涉黃”內容遠離用戶也是十分重要的。
最後更新:2017-08-25 14:54:27