網絡安全的四層智能化革命
在剛剛落幕的第20屆Blackhat大會上,“機器學習”被反複提及,人工智能在網絡安全各個領域得到廣泛探索和應用嚐試。人工智能在網絡安全領域已經從早期的概念炒作,向方案落地轉變。
當人工智能遇上網絡安全,在紛繁複雜的技術與應用方案背後,可以歸納成執行層、感知層、任務層和戰略層四大層麵的智能化,不僅幫助解決現有的一些安全難題,未來的發展也非常有想象空間。
網絡安全新戰場需要AI填補人才緊缺
目前網絡安全已經進入了一個嶄新的時代,麵向各種新戰場,需要新的架構、新的方法、新的編程語言來支撐我們應對越來越艱巨的戰鬥。新戰場以黑產對抗、反勒索軟件、反Insider-based APT、物聯網/車聯網這些新方向為代表。比如很多攝像頭、智能門鎖、兒童手表,都是成批次的被攻破,車聯網與智能車的安全問題也引起業界的嚴重關注和顧慮。
眾所周知,在移動互聯網時代,安卓的碎片化生態幾乎已經失控了。不少手機廠商對某些低版本的手機係統都不再進行升級,盡管還有很多用戶在用,這就帶來了嚴重的安全隱患,惡意代碼可以輕易通過攻擊幾年前的安卓漏洞來獲利。進入物聯網時代,這種情況會更加嚴重。很多硬件廠商在開發產品的時候完全沒有考慮引入專業安全服務,最終麵臨嚴峻的安全漏洞時卻難以應對。
一方麵是新的攻擊不斷湧現,另一方麵防守方卻顯得捉襟見肘了。安全的核心是對抗,而對抗是多維度的、持續的。為了進行有威懾力的對抗,最大的挑戰還是缺少高素質安全專業人才。在這種情況下,我們隻能靠AI,也就是靠人工智能來填補人才空缺。
對於人工智能的看法業界出現兩極分化:一種觀點認為AI可以幫人類完成一切工作,另一種認為AI會毀滅人類。事實上沒有絕對的黑白,AI的作用也遠遠沒有這麼極端。AI能做什麼?吳恩達教授給出了很好的解釋:一方麵,正常人類1秒內能做出的判斷,AI也能做的很好。比如無人駕駛時代已經悄然來臨,人臉識別、語音識別,現在機器也能夠做到很高的準確率。另一方麵,通過大量已經發生過的具體重複事件,AI能很好的預測即將發生的事情。
當AI遇到網絡安全
當AI遇到網絡安全時,又會發生什麼樣的化學反應呢?
網絡安全是一個非常複雜的體係,可以分為執行層、感知層、任務層和戰略層。現在AI已經可以在執行層和感知層有不錯的應用,同時在任務層和戰略層已經開始摸索,但還處於比較初期的階段。
(一) 執行層:顯著提高安全運維效率
在執行層,AI可以顯著提升安全工具的規則運維效率。規則體係的觸角在整個安全網絡體係裏麵的延伸非常廣泛,包括像殺毒、WAF、反SPAM、反欺詐等。這些領域在傳統模式中需要大量的人力來維護,比如像反欺詐係統裏麵可能有上千條規則,這些規則之間存在著很多的衝突,某些規則組合甚至超出了人的理解能力,人在維護這些規則的時候也常常會出現問題。
而依靠AI,就可以很好的解決這些情況,機器學習已經展示出非常強大的價值。它可以自動生成規則,不用依靠龐大的人力資源來維護。而且安全事件通常是大量發生的,所以AI能夠比較好的識別判斷下一次事件。
AI是如何做到的呢?機器學習能自動生成規則,但是其中的學習深度還是有一定的區分。“淺學習”以SVM、Random Forrest、GBDT等算法為代表,它還需要很多的人工特征工程來準備特征向量,然後由算法自動完成分類識別。在風控領域,運用最廣泛的是GBDT(很多比賽的冠軍都是用GBDT),但是當特征維度上升到數千維後,深度學習的優勢就開始慢慢展現出來。深度學習和“淺學習”存在一個很大的區別,就是深度學習對特征工程的依賴減弱很多,它能比較好的自動提取特征,可以生成深度學習模型,比如CNN(卷積神經網絡)和RNN(循環神經網絡)技術等。
舉例而言,AI在移動殺毒引擎的應用效果明顯。眾所周知,現在病毒種類的變形越來越多,大多數黑產都會進行不同的嚐試。如果用人工來構建那些惡意代碼的識別特征,就需要構建一套非常龐大的體係,不僅慢而且難以維護。百度利用深度學習技術在這方麵取得了非常出色的成果,在曆次AV Test測試中長期保持第一。去年百度安全在頂級安全工業界會議 Blackhat Europe 上就此成果做了專題報告,也是目前全球安全工業界第一個有實質性進展的深度學習應用技術報告。
另一個例子是AI在網頁安全中的應用,效果也非常顯著。目前網頁安全的威脅主要包括三類:第一種欺詐類網站,包括虛假高校、虛假藥品、假冒貸款、仿冒火車票、虛假金融證券、仿冒飛機票、虛假中獎、仿冒登錄、虛假招聘等;第二類是存在風險的網站,主要包括網頁掛馬、惡意代碼、隱私竊取、惡意跳轉、僵屍網絡通信、木馬下載主機等;第三類是違法網站,包括色情和博彩等。
百度每天爬取索引的數據中,有1%~5%的URL包含不同程度的惡意信息,如果不加防護將會對網民帶來巨大的傷害。百度安全通過規則體係、機器學習(淺層模型)、深度學習(文本)、深度學習(圖片)以及威脅情報挖掘等網址安全複合檢測算法來保障網站的安全。目前,百度安全利用機器學習進行網頁檢測,對惡意信息的防護已經取得了很好的成果。單條樣本檢測時延已經小於10ms,對非法網站的識別準確率已經超過99%。百度安全團隊也受國際安全學術泰鬥 UC Berkley Prof. Dawn Song 邀請,在 Singapore Cyber security Consortium (SGCSC) 上就此成果做了專題報告。
(二) 感知層:生物特征識別與對抗的興起
在感知層,當下最重要的應用就是生物特征認證。人臉認證是目前AI在安全領域最成功的一個應用。整個認證流程看起來簡單,其實裏麵的技術相當複雜:首先需要在各種環境下準確追蹤人臉,如果有偏差能夠給予及時有效的提示;其次要在最小用戶打擾的情況下完成可靠的活體識別,而不被虛假照片或化妝欺騙,能高速完成可信人臉數據對比。第三,設備和應用的安全狀態也需要可靠的保障,一旦發現惡意攻擊可以即時進行取證。最後,還必須要在雲端對用戶隱私信息有著嚴格的保護。因此,要實現順滑的人臉認證體驗,必須要有AI技術和係統化安全技術做全麵支撐。
為什麼要在安全過程中用AI感知來做人臉識別?因為銀行或者運營商對於客戶的實名認證環節,傳統上是要靠人來完成的。但是人其實是在整個安全過程中最容易被攻破的一環,攻擊者可以找到很多理由,比如最近胖了/瘦了/病了等來蒙混過關。如果是AI來做這件事,反而鐵麵無私,能夠把這個體係構建的更加標準化,並隨著技術的進步不斷完善。
目前,百度的人臉認證已經能夠在秒級內完成超過90%的高可信驗證比率,顯著高於業界平均水平,並且已經在實戰中積累了很多活體識別對抗的經驗和能力。除此之外,我們也在聲紋識別、用戶行為識別等領域做了很多應用探索和嚐試。
(三) 任務層和戰略層:尚處在初級探索階段
將AI應用於網絡安全任務層和戰略層,在某些國際大賽上已經開始嚐試,但目前還隻是封閉空間的自動對抗。其中最著名的就是 DARPA 主辦的 CGC 大賽,比賽讓7個頂級團隊構建自動化係統,對有缺陷的服務程序做自動加固,然後相互攻擊,不僅要抵抗外來攻擊,同時還要反擊對手。但是,這個還不能說是人工智能,因為所有的邏輯都是人預先設定好的。也就是說,目前仍然停留在自動化階段,還在向AI方向摸索。
在安全的任務層和戰略層要真正達到人工智能的高級階段,首先要解決人工智能對開放空間的認知問題,包括世界認知、人性弱點、創造力、跨維打擊等方麵,其實還有很長一段距離。不過最近在相對封閉的任務空間中的人工智能探索研究,已經取得了很好的進展,相信在不遠的將來會有一些顛覆性的應用產生。
總結
人工智能在網絡安全領域的應用,執行層上麵已經實用化,可以顯著的提升規則化安全工作的效率,彌補專業人員人手的不足;在感知層麵,可以把原本依賴於人(不可靠)的安全體係標準化,現在已經開始實現大規模的推廣,包括人臉識別和圖象識別等也等;AI在任務層上的摸索剛剛開始,在某些封閉任務領域已經展現出很好的潛力;在戰略層,由於開放空間的特性,AI的路還比較遙遠,所以大家還不用擔心“天啊,人類要毀滅了”這樣的問題。同時,隨著人工智能在安全領域的應用,圍繞著人工智能技術本身的攻防對抗也成為學術界的研究熱點,相信其中的研究成果很快也會在安全實踐中得到應用。
本文作者:韋韜
來源:51CTO
最後更新:2017-11-03 15:35:04