917
機器人
人工智能犯罪細節首次披露:你的個人信息是這樣被破解的
一起個人信息罪案中,人工智能技術參與到數據泄露的核心環節,從而助長“徐玉玉案”式精準詐騙,且非法獲取個人信息的成本大幅降低。
(2016年8月19日,山東省臨沂市羅莊區高考錄取新生徐玉玉被犯罪嫌疑人以發放助學金的名義,實施電信詐騙騙走9900元。案發後,徐玉玉與父親到公安機關報案,回家途中心髒驟停,送醫院搶救無效死亡。2017年7月19日,山東臨沂,徐玉玉的父親相信法律的公平。圖/視覺中國)
《財經》記者 劉甦/文 李恩樹/編輯
人類圍棋界“最強大腦”敗於人工智能Alphago時,另一人工智能已經進入違法犯罪的黑色領域。
一起普通的網絡代付詐騙,牽出一個利用人工智能技術、一秒鍾盜取2000組公民信息數據的犯罪團夥。通過深挖公民個人信息賬號密碼買賣這條線索,浙江紹興警方發現一條涉及利用黑客技術非法獲取網站後台用戶注冊數據、數據撞庫、繞開互聯網公司安全策略的打碼平台、網絡詐騙、非法信息推廣的互聯網黑色產業鏈。
這一黑產鏈條中,參與到數據泄露環節的人工智能技術頗為關鍵,使得非法獲取個人信息的成本大幅降低。
量販個人信息
2017年2月9日晚,紹興市公安局越城區分局城南派出所接到公民虞玉華報案稱,虞當晚收到好友王甜的一條信息,王甜購買一件價值1922元的商品,因手機支付不成功,請虞幫忙代付。虞玉華通過手機為好友支付貨款後,對方再次要求付款,她疑心被騙因而報案。結果證明,王甜的賬號被盜,有人冒充王甜對其好友實施詐騙。
接到虞玉華報警後,越城警方在哈爾濱抓獲這個利用社交軟件冒充好友實施代付詐騙的犯罪團夥。團夥成員十餘人,均為同學關係。
他們在哈爾濱一個居民小區裏租了一套兩居室,客廳被改造成工作室,碼放8台電腦作為作案工具,吃住、詐騙都在這套出租屋內進行。團夥分工明確,頭目鄭前負責招募人員、培訓和購買作案工具,其他成員登錄不同種類的社交軟件實施詐騙。
在這個團夥的電腦中,紹興警方發現大量公民個人信息。“信息最多的一台電腦中有300多GB的個人信息,包括多個郵箱、社交軟件的賬號和密碼,而且都很準確。”越城區公安分局網警大隊大隊長錢立鋒向《財經》記者介紹。
這些信息從何而來?鄭前稱,這些信息是他以一組2元左右的價格,共花40多萬元從吳傑等人手中買來的。而吳傑手中的信息則來自一個黑客犯罪團夥,該團夥利用超級SQL注入工具、網站漏洞掃描軟件,批量掃描網站程序漏洞,非法獲取網站後台用戶注冊數據,這被稱為“脫庫”。
這些數據大多是郵箱賬號和密碼。獲取網站後台數據後,黑客團夥將包含各類郵箱和密碼的數據分門別類進行銷售,以每10萬條數據50元到100元的價格賣給吳傑等人。
獲取數據後,吳傑等人用“撞庫”軟件進行批量撞庫、匹配,進而將各類賬號與密碼匹配成功的賬戶以1.2元到2元一個的價格,販賣給網絡詐騙犯罪團夥。
“撞庫”是黑客通過收集互聯網已泄露的用戶賬戶和密碼信息,生成對應的字典表,嚐試批量登錄其他網站後,得到一係列可以登錄的賬號。
“脫庫”竊取到的郵箱、社交軟件等賬號密碼信息大多是單一的、無效的,需要將這些信息進行“清洗”。
錢立鋒告訴《財經》記者,很多用戶習慣在不同網站使用相同的郵箱賬號登錄,甚至登錄賬號密碼也和郵箱一樣。黑客可以通過獲取用戶在A網站的賬戶從而嚐試登錄B網址,這就完成一次“撞庫”嚐試。
經過“撞庫”清洗後,一些賬號關聯的其他平台賬號被順利登錄,完成“清洗”後的數據更為豐富,可以精準獲知該用戶的許多平台注冊信息,這在犯罪分子眼中極有價值,價格也隨之漲高。
去年山東女大學生徐玉玉被詐騙分子以發放助學金的名義,騙走全部學費9900元,在報警回家的路上猝死,就是由於騙子掌握了徐玉玉準確的錄取信息、手機號碼等個人信息,精準實施詐騙。
“碼奴”產業
為了防止黑客批量測試賬戶密碼,各網站和平台動了不少腦筋,“驗證碼”是常用防範手段之一。
網絡用戶在各大網站或者平台注冊、登錄賬號時,經常可以見到包括字符式、數字、字符+點選式、滑塊拚圖式、圖片人工答題式等驗證碼,其中字符型驗證碼形式是互聯網行業普遍采用的驗證碼形式。
驗證碼的防範機製是:提出的問題要容易被人類解答,而讓機器無法解答。
當賬號登錄存在異常的時候,為了保護賬號安全,係統會提示輸入驗證碼。其目的是防止黑產人員批量惡意登錄——他們可以利用機器大量輸入賬號和密碼,但是機器無法識別驗證碼。由此,對於想要獲取精準個人賬戶信息的犯罪團夥,在“撞庫”環節中,如何進行批量驗證就成為關鍵。
由於無法規避驗證碼,黑客們若要試出有效密碼,需要人工逐條輸入信息和識別驗證碼,比對、驗證並成功匹配個人信息的賬號密碼,確認信息準確可以使用,再交給數據商——這些人在圈內被稱為“碼奴”,這一環節也被稱為“打碼”。
一位“碼奴”向《財經》記者透露,根據驗證碼的複雜程度和輸入的準確率,打1000個驗證碼會掙取1元至25元不等,每天工作12小時,最多可以輸入2萬個驗證碼,掙到300多元。
最熟練的“碼奴”輸入一個驗證碼也需要一秒鍾時間。在傳統的信息泄露相關犯罪中,因高昂的人力資本和較為漫長的工作周期,被“清洗”的數據相對有限。
因此在查獲巨量個人信息後,越城警方意識到,這一係列案件中的“打碼”絕非人工識別完成。隨後警方調查發現,該案中,拿到原始數據的數據商,通過一個名為“快啊”的打碼平台進一步進行深加工。
工商信息顯示,“快啊”平台是沈陽納信科技有限公司旗下產品,該公司經營範圍為計算機科學技術研究、計算機軟件開發、網絡技術研究、網絡工程設計、計算機軟件銷售等。警方在調查中發現,該平台專為網絡黑產和灰產識別破解字符型驗證碼提供技術幫助。
打碼平台上有多種針對不同互聯網產品進行“撞庫”的軟件,數據商將驗證碼傳給“快啊”打碼平台的某一“撞庫”軟件識別接口,打碼平台將驗證碼發給後端的“碼奴”進行識別,並獲取識別結果。
越城警方對“快啊”平台數據分析獲知,接入該平台提供驗證碼識別服務的“撞庫”軟件有100多款,接入平台的用戶達1.1萬餘人,從2016年6月到2017年3月,平台資金進賬累計達1650萬元,為國內最大的“打碼”平台。
錢立鋒介紹說,“打碼”平台目前遊走在法律邊緣,界定並不清晰。“什麼樣的人需要批量識別驗證碼?往往都是從事網絡黑產和灰產的人員。”
(犯罪嫌疑人使用的部分作案工具)
除黑色產業的詐騙人員,打碼平台的通常使用者是“羊毛黨”、搶票的“黃牛”及論壇刷帖“水軍”。
以“羊毛黨”為例,一些網貸平台為吸引投資者常推出一些收益豐厚的活動,如注冊認證獎勵、充值返現、投標返利等,催生了以此寄生的投機群體“羊毛黨”。“羊毛黨”去某網站刷活動優惠券,但該網站有較複雜的驗證碼,通常“羊毛黨”會在打碼平台注冊賬號並充值,並通過打碼平台提供的接口,提交驗證碼識別。打碼平台將驗證碼分發到各個“碼奴”客戶端裏,獲取識別結果,並最終反饋給“羊毛黨”。
據辦案民警介紹,“快啊”平台被查的前三個月,已提供驗證碼識別服務259億次。
(犯罪嫌疑人與贓款)
在人力資源有限的情況下,“快啊”平台如何做到可以提供巨量的驗證碼識別服務?越城警方在其背後發現一個無需“碼奴”的高級“打碼”技術。
AI“打碼”
隨著偵查深入,越城警方發現,為“快啊”平台提供驗證碼識別服務的一個重要軟件係統名為NID,這一人工智能程序由廈門人楊柯設計。
楊柯現年33歲,家境優越,父親是當地房地產開發商,他和妻兒住在廈門一處140多平方米的住宅裏,每平方米售價近5萬元。
畢業於廈門某大學計算機專業的楊柯研究人工智能已有十餘年。楊柯稱,他使用伯克利大學開發的caffe框架作為深度學習框架,並且使用VGG16結構創建了一個神經網絡,之後從網絡上下載了幾乎全世界所有字體,對神經網絡進行訓練,使它具有圖文轉換的能力,再將這個神經網絡與具有圖像接受和處理結果返回功能的服務端進行網絡連接,構成一個係統,命名為NID。
每天,像教兒童一樣,楊柯要培訓NID學習識別各種驗證碼。在他的“培養”下,NID破解驗證碼的能力越來越強。
(楊柯製作的驗證碼樣本庫)
錢立鋒告訴《財經》記者,通過運用人工智能機器深度學習技術訓練機器,楊柯讓NID如AlphaGo一樣自主操作識別,有效識別圖片驗證碼,輕鬆繞過互聯網公司設置的賬戶登錄安全策略——驗證碼。
由於人工智能的幫助,NID“打碼”速度很快,平均一秒可以識別出2000個驗證碼,是人工“打碼”的2000倍;且正確率很高,可以識別出98%以上的驗證碼。
楊柯稱,NID程序剛編寫完成,正確率就高達95%,基本能正確識別所有清晰圖片中的文本,楊柯還不斷充實樣本庫,給NID程序輸入大量的圖片文件讓其進行識別,NID程序本身就具備很高的識別應對能力;此外,NID係統也會自動學習,它每秒鍾會從用戶反饋的識別錯誤樣本庫中抽取一張比對正確答案進行學習,這個學習過程從編寫出程序到案發前,時刻進行。
驗證碼被NID係統識別出後,黑客竊取的半成品信息,相當於完成了深加工。數據商拿到這些精準信息,打包組合,出售給個人信息產業鏈下遊的詐騙集團、廣告商,一條精準的個人信息,甚至可以賣到幾百元。
“快啊”打碼平台收取信息處理費用,收入的50%給了撞庫軟件作者,50%由平台開發商李奇和楊柯平分。短短一年內,平台牟利1300多萬元,楊柯分得300多萬元。利用NID程序,多的時候,楊柯一個月可以掙六七十萬元。
2017年3月23日,“快啊”平台涉案被越城警方偵查。由於該案犯罪手法新穎、社會危害大,越城公安分局成立由網警牽頭,刑偵、特警、派出所等多部門配合組成的專案組。
圍繞該產業鏈的上下遊,專案組輾轉福建、廣東、江西、黑龍江、遼寧、山東等13個省展開偵查、抓捕,抓獲利用黑客技術非法獲取網站後台數據的嫌疑人4人,使用撞庫軟件獲取賬戶密碼的嫌疑人19人,提供圖片驗證服務的“快啊”打碼平台嫌疑人2人,製作“撞庫”軟件的9人,利用公民個人信息實施網絡犯罪的團夥28個,共159人。
防範難題
一位數據安全專家介紹,“快啊”打碼平台利用NID程序對字符型驗證碼的破解,是基於人工智能的深度學習框架,使用相關的網絡模型訓練學習,來實現對字符型驗證碼的海量快速識別破解。由於字符型驗證碼是互聯網通用的安全策略,一旦被破解攻陷,將會給包括政企網站在內的互聯網行業用戶數據安全帶來風險。
基於深度學習原理,隻要樣本庫足夠豐富,這一智能程序可以識別的東西會越來越多——即使複雜如鐵路訂票平台12306的驗證碼,也隻是物品種類多、形態多樣的圖片識別,假以時日,NID程序一樣可以破解。
騰訊安全專家周正認為,互聯網行業的安全防範主要是對抗有規律、有特點的惡意行為,對抗這種有深度學習能力的人工智能犯罪,有必要提升防範等級,增加多維度的安全驗證環節。
比如,登錄時使用字符型驗證碼,二次登錄用短信或郵件驗證,輔助以滑塊解鎖等方式,“對抗不斷升級的入侵攻擊,提高犯罪門檻,強化動態機製,是互聯網安全行業一直在做的事情”。
人工智能(Artificial Intelligence),英文縮寫為AI,是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用係統的一門新的技術科學。
隨著科技發展,近幾年,“人工智能”這一概念通常指的是穀歌等公司開源的一些基於神經網絡進行深度學習、可以不斷訓練強化神經網絡的人工智能。楊柯開發的NID程序即屬於這一人工智能範疇。
基於“深度學習”的新型人工智能,極大降低了網絡黑產犯罪成本。如NID程序對字符型驗證碼的識別破解已快到毫秒級,“打碼”平台的效率和業務量借此呈指數級別增長。而作為“驗證”這一重要的網絡安全環節,被攻陷後可被不法分子用於多個不同場景作惡,如撞庫、竊取信息、惡意灌水發帖、刷單、刷點擊量等,危害互聯網生態。
錢立鋒感慨,以往的黑客攻擊針對網站漏洞入侵,相當於“開鎖式進入”,而借助於人工智能,進攻方式變成了“硬闖”。
值得關注的是,這一案例是否意味著人工智能犯罪時代已經到來?
北京交通大學計算機與信息技術學院副教授王偉介紹,目前人類已經掌握了“弱人工智能”,即能製造出真正推理和解決問題的智能機器,這些機器並不真正擁有智能,也不會有自主意識,同在各方麵能和人類比肩的“強人工智能”和比人類大腦聰明許多的“超人工智能”相比,“弱人工智能”隻是人工智能的初級階段,NID係統屬於此列。
基於此,上海財經大學法學院副院長胡淩認為,上述案件中,“人工智能”隻是輔助犯罪嫌疑人實施犯罪的工具和手段,犯罪主體仍然是人而非機器,尚在中國刑法規製範圍內。
不過,錢立鋒認為,在打擊互聯網技術類犯罪麵前,《刑法》在適用上還有很多待商榷之處,譬如如何理解主觀明知、證據標準如何把握、宣告刑普遍偏輕等問題,在適用上應統一認識。
另外,電信詐騙等犯罪的辦案主體往往是縣一級公安機關。雖然電信詐騙辦案難度不大,但為打掉整個黑色產業鏈,需要辦案人員向上追溯到信息泄露、“打碼”等技術環節。但實際中,證據固定難度通常很大——數據會被犯罪分子刪除,數據經網絡流轉後,調取比較困難,縣級公安的技術能力往往有限。
錢立鋒以上述案件舉例,該案技術門檻高,複雜程度也很大,辦案機關扣留涉案設備後需要將“撞庫”軟件、“打碼”平台程序、神經網絡圖片驗證碼識別程序三個不同功能的軟件重新搭建,模擬現實環境,全程錄像取證,協同作業後,才能認定為一個能完整實現破解識別字符型驗證碼、“撞庫”、“洗庫”的軟件係統。
今年10月16日,在最高檢察院召開的新聞發布會上,最高檢公訴廳副廳長張相軍表達了類似觀點。他指出,與傳統的刑事犯罪相比,網絡犯罪具有主體的智能性、行為的隱蔽性、手段的多樣性、傳播的廣域性等突出特點。
與這些特點緊密相連,檢察機關懲治計算機網絡犯罪方麵遇到的難點主要有取證和證明難——網絡空間所有行為通過數字化的形式完成,沒有目擊證人,網絡犯罪證據多以電子數據為主要形態,偵查取證主要依賴技術手段完成;此外,網絡犯罪的取證、鑒定、定性等都需要很強的專業知識,檢察機關辦理此類案件需要大量專業人才。但從目前的實際情況看,檢察機關網絡技術人才十分缺乏,既精通法律業務又熟悉網絡技術的複合型檢察人才更是匱乏。
周正對未來表示擔憂。他認為,上述案件雖然僅是個案,有一定的技術門檻。但可以看出,網絡黑產犯罪分子對技術應用到如此程度,已極盡所能。“人工智能本身是一種技術,但隨著高速發展,已成為雙刃劍,如何用好這項技術,值得更加深入地研究和實踐。”
整體而言,技術犯罪數量在不斷上升。最高檢新聞發言人王鬆苗在前述新聞發布會上表示,2016年以來,全國因涉嫌計算機犯罪被檢方提起公訴的共1568人,僅今年1月至9月就有710人,同比上升80.7%。41169人因涉嫌網絡電信侵財犯罪被公訴,今年前九個月就有22268人,同比上升118.6%。
最高檢會同最高法正在共同研究起草《關於辦理網絡犯罪案件適用法律若幹問題的解釋》,將針對《刑法修正案(九)》增設的拒不履行信息網絡安全管理義務罪、非法利用信息網絡罪、幫助信息網絡犯罪活動罪,明確定罪量刑標準和有關法律適用問題。
(文中受害人、犯罪嫌疑人均使用化名)
(本文首刊於2017年10月30日出版的《財經》雜誌)
最後更新:2017-11-05 18:03:14
上一篇:
人工智能龍頭從98跌至7元,季報業績暴增965%,下周有望暴漲成妖
下一篇:
富者更富、窮者更窮,人工智能該背個鍋……
收購三年之後,穀歌助手將總管Nest智能家居,人工智能競爭加速
洪小文:人工智能簡史之從寒冬到複興
如果王力宏看了《機智過人》,也許就不會浪費“人工智能”這個好選題了
仿如隔世(2):人工智能之神科大訊飛活下來的奶牛是什麼?前員工來信:三四億的利潤,有一半來源於彩鈴,對,你沒看錯,就是彩鈴!
人機對戰:人工智能選股ETF跑贏美股大盤,秒殺人類
北京航空航天大學王田苗教授:人工智能與機器人前沿科技發展與投資布局
機器人代替人工的時代徹底來臨,各行各業都將洗牌
阿爾法狗擊碎的信心 在AI×學習世代可以重拾
人工智能識別欺詐行為,點擊幾下鼠標就能判斷是否說謊
人工智能+互聯網後,醫療行業竟成最大受益者