閱讀897 返回首頁    go 阿裏雲 go 技術社區[雲棲]


專訪陳磊:拍拍信與金融數據AI


image

陳磊:
拍拍信(PPCredit)數據科學副總裁, 上海交通大學EE碩士,曾任職eBay分析經理,Opera Solutions分析總監。作為數據行業老兵,擁有超過十年的數據管理和統計挖掘經驗,為電信、零售、金融等行業客戶提供端到端數據分析和產品解決方案,在數據+技術驅動業務領域有豐富的積累。

大綱:
普惠金融的發展遇到移動化的浪潮,使得消費信貸迎來了高速攀升期,同時也給風控帶來了巨大的挑戰,即在額度區間廣、借貸頻次高、客群下沉情況下,如何實現風險可控、差異化定價、快速審批。幸而大數據和AI技術使得這一切變為可能,拍拍信一直在做這方麵的探索,旨在整合數據資源、充分發掘數據潛在價值,幫助金融機構夥伴搭建和優化風控係統,我們將在會上分享相關的實踐經驗和落地案例

ArchData技術峰會將於9月9日上海徐匯COCOSPACE開幕,在大會之前,中生代技術特邀專家記者王公仆對陳磊總做了會前訪談

陳總您好,首先感謝您花費寶貴的時間來參加ArchData峰會,給大家分享拍拍信業務中的AI技術話題,正式會議前,我這裏有一些問題想請教您

王公仆:之前在杭州地鐵上看到過拍拍貸的廣告,能簡單介紹下拍拍信公司,目標客戶和主營業務嗎?
陳磊:拍拍信數據服務(上海)有限公司成立於2016年3月8日,始終秉承著“專注,服務,創新”的態度,以“數據定義未來,信用改變中國”的理念,致力於幫助客戶解決數據應用和風險控製問題,並不斷優化迭代我們的技術與服務,為客戶帶來更好體驗。目前客戶主要分布於金融行業,如互聯網金融平台和消費金融持牌機構,主營業務包含但不限於信貸評分、定製化模型、信貸全流程解決方案和係統、反欺詐知識圖譜。

王公仆:請您簡單介紹下在拍拍信內部,AI技術被用在了哪些產品或業務中,效果如何?

陳磊:目前AI技術主要被用於以下幾個方麵:
信貸模型:基於深度學習的特征提取,相對於傳統的專家經驗提高了自動化和可擴展性,同時使得高階特征的提取成為可能,最終模型性能有大幅提升;
圖像識別:身份證信息提取和銀行卡識別,幫助客戶實現風控流程的自動化;
知識圖譜:複雜網絡的識別和挖掘,已被應用於欺詐團夥的識別。

王公仆:作為金融行業的信貸公司,請問你們是怎樣進行信用建模的呢,原始數據從哪裏獲取呢?

陳磊:我們目前的定位是有深厚金融業積累的數據服務公司:
拍拍信可以提供客戶標準化的信貸評分,也可以根據客戶的需求來定製化信貸評分;
整個的模型周期基本包含數據收集, 數據清洗, 特征工程, 模型訓練, 模型驗證與迭代,模型上線後的自學習也是我們的一大特色;
數據來源主要包含:
a.自有積累數據
b.合作方的授權數據
c.有定製化需求客戶提供的脫敏數據

王公仆:在金融信貸領域,風險控製需要做哪些工作呢?

陳磊:風控覆蓋用戶的整個生命周期貸前/貸中/貸後:
貸前的審核和授信;
貸中的異常監控;
貸後可能的催收。

王公仆:在線上的信貸業務,會遇到哪些信貸方麵的挑戰和業務機遇?

陳磊:
風險相對於線下增大,線下信貸客戶真實性可控;
數據維度更多,但稀疏;
用戶體驗需求高,進件規模大,對自動化的要求高。

王公仆:在金融特別是風控的數據建模/數據研發方麵貴公司是如何利用機器學習和大數據進行創新的呢?

陳磊:
先進算法的應用,如Boosting、Deep Learning;
大數據平台的建設,Spark集群,打通數據流和工作流。

王公仆:在大數據方麵,貴公司擁有的數據量級是多大呢,一般是用哪種技術存儲和計算的呢?

陳磊:目前數據在百億級,約100T。用HDFS/Hbase存儲,及Hive/Impala/Spark進行計算。

王公仆:在數據可視化方麵,貴公司是如何做技術選型的呢?

陳磊:前端以E-chart為主考慮到公司處於創業初期,所以選擇開源技術,再加上一部分自主研發。

比如報表係統我們使用Pentaho,多維分析使用Kylin+Saiku,然後自主研發的數據門戶網站等。

王公仆:最後請問在數據安全領域,貴公司是如何保障客戶數據隱私安全的呢?

陳磊:會從多個層麵來保證數據安全,比如係統隔離、數據加密及脫敏。

王公仆:最後感謝您接受采訪,謝謝。

原文發布時間為:2017-09-01
本文作者:王公仆
本文來自雲棲社區合作夥伴“中生代技術”,了解相關信息可以關注“中生代技術”微信公眾號

最後更新:2017-09-01 15:02:36

  上一篇:go  高紅冰:1個貧困縣連接280個城市 電商減貧潛力巨大
  下一篇:go  萬能的Python背後:這6大原因讓它爆火