京東金融雲發布:從數據中來,到實體中去
內容來源:2017年11月6日,由京東金融與紅杉資本聯合主辦的首屆“JDD-2017京東金融全球數據探索者大會”正式在北京拉開大幕。大會上,京東金融副總裁、技術研發事業部總經理曹鵬發表主題演講。筆記俠作為合作方,經主辦方審閱授權發布。
責編| 清野 kay
第1830篇深度好文:5119 字 | 8 分鍾閱讀
全網首發·完整筆記·人工智能
本文新鮮度:★★★★★口感:金蛋
筆記君邀您,先思考:
京東金融有哪三大優勢?
京東金融雲的架構是怎樣的?
京東來客怎麼定義?
大家好!很高興今天能有機會跟大家分享一下我們京東金融過去跟現在做的一些事情,也希望能有機會跟大家討論一下怎麼樣才能創造出更多的價值。
一、從數據中來,到實體中去
先做一個自我介紹,京東應該大家很熟悉,現在是中國最大的零售商,2016年我們的GMV(Gross Merchandise Volume,在電商網站定義裏麵是網站成交金額,實際指的是拍下訂單金額,包含付款和未付款的部分)將近1萬億,服務人口覆蓋了全國99%的區域。
京東金融就是京東在2013年的體係裏麵孵化出來的一家技術公司。
我們在做什麼?用一句話概括,從數據中來,到實體中去。
連接數據跟實體的就是我們的技術,我們的定位也在幾年時間裏麵不斷思考和調整,從最早的互聯網金融公司到後麵的金融科技公司,大家可以看到,現在我們的定位是一家服務於金融機構的科技公司,我們可以幫助金融機構提高效率、降低成本,增加收入。
四年的時間,我們快速搭建了從企業金融、供應鏈金融、消費金融到財富管理、支付到最新的海外業務等十大業務板塊,服務了3.6億個人用戶,超過8百萬線上、線下商戶,四年交易規模累計增長了24倍。
所以,現在京東金融已經是全球金融科技裏麵增長最快的公司之一了!
並且我們的增長得到了整個行業的認可,2017年我們獲得了亞洲銀行家信貸風控技術實施獎和歐洲金融全球卓越司庫獎,前者代表了金融對我們金融風控的認可,後者代表了對我們商業模式的認可。
二、京東金融的三大優勢:
場景、數據、技術
很多人會問,京東金融為什麼發展這麼快?其實非常簡單,我們有三個得天獨厚的優勢,場景、數據、技術。
場景
大家可以看到我們有非常豐富的場景,從互聯網到零售、物流、支付,再從校園到城市、農村,這麼豐富的場景給我們做業務的創新和嚐試提供了無數的機會和可能性,所以我們才能夠這麼快速地做這麼多創新性的業務。
數據
大家知道我們是一家互聯網公司,互聯網公司的大數據基因是與生俱來的,從前端的場景裏積累了大量數據,而且我們的數據特點不光大,不光類型多,在數據的厚度和活性上麵也有非常不錯的表現。
大家應該知道,做一個風控模型你的數據量可能很大但是很薄,這個是做不了的。
另外數據也有時效性,一個樣本集一年以後的有效數據可能隻有50%,到了第三年的時候,真正能再有效的數據可能隻有10%。
這樣的數據量再大也沒有用,所以我們花了很大的精力構建我們的數據體係,現在我們已經有超過30多個數據源,對於用戶的標簽有超過3萬,係統每天增加200TB的數據,處理超過200億條的用戶行為日誌,這就是我們的數據能力。
技術
這個詞很寬,但是在這個領域裏麵我們經常用到的可能就是三個詞,人工智能(AI)、大數據(Big Data)、雲計算(Cloud Computing)。
對於京東金融來講,從我們成立的第一天起,所有的係統架構都是基於人的、分布式的,成立的時候就有很強的海量數據處理能力。這幾年我們在補什麼?花了很多精力重點補充了人工智能相關的技術。
到今天為止,我們的技術已經從最底層的數據處理、標注、計算能力的分配到中間那一層算法的構建、通用的算法服務,再到最上麵一層針對於金融的特定場景所做的產品層,我們已經構建了完全的AI能力。
三、京東金融雲
大家可能會說,你說了半天跟我們有什麼關係?
就好像我們開始說的,我們想要做的就是服務傳統金融機構,希望能夠和金融機構做一個深度的連接,形成利益共同體,把我們兩方的能力進行互補。
這個合作模式是怎樣的?
我們不是想要進來跟大家競爭,也不是說我要去賣一套軟件,我們更希望的是,我們不是賣你一台發動機,我們是要跟你一起來造一台車,一台很漂亮的馬力強勁的車,這樣我們可以乘著它一起把這個行業帶得更遠。
為了實現這個目標,我們做了什麼?
我們把四年之間所積累的所有數據和技術進行了重新整合和打包,然後推出了整個的京東金融雲服務。大家可以看到,市場上的雲的服務商很多,他們大部分其實都集中在下麵的兩層做基礎設施、做平台。
京東金融雲特點在哪裏?
我們不僅有底層的雲服務的構建能力,還有最上麵的一層FAAS金融科技及服務。
這裏麵裝的就是我們積累下來的從支付到賬戶、風控、營銷、資產證券化一係列的模塊化能力,這樣我才能夠更好的跟我們所有的金融機構進行對接、整合,才能夠更貼近終端場景、終端用戶,才能夠達到更好的效果。
金融雲的服務產品很多,也沒有辦法一一給大家解釋,下麵我就從相對通用的模塊給大家做一展開。
1.智能營銷
我們的智能營銷模塊叫京東來客。
京東來客怎麼定義?
我們要做到運營的效率和成本的控製率做一個完美的結合,那麼,營銷這個事情說起來可能很複雜,不同的行業也不一樣,但是歸根到底基本都會定在這指標上麵,一個是LTV,一個CAC。
LTV是什麼?
就是用戶整個生命周期裏麵能夠為你貢獻的價值,CAC就是你為了獲取用戶所獲得成本。我們的來客係統就在這兩件事情上做文章:
一方麵,通過非常高效的運營工具幫助你去提升用戶黏性增加轉化,增加用戶對你的貢獻;
另一方麵,通過精準的模型投放,降低你的獲客成本。
怎麼做到?很簡單,前麵已經說了,我手裏有大量的數據,有超過3萬的用戶標簽。
我們會在這套係統裏麵開放我們之前積累的所有的用戶標簽,開放京東十幾年運營和營銷所積累下來的經驗,把它變成模型物化在係統裏麵,大家就可以直接使用。
簡單來講,一個合作夥伴的運營人員可以使用我們的係統快速搭建一個活動營銷的頁麵,然後選擇一個跟你的活動最匹配的模型,通過我們線上、線下打通的渠道投放出去,後麵有非常完備的數據和報表分析係統。
你說,我的經驗不夠,怎麼辦?不夠也沒有關係,一方麵我們有豐富的模板可以給你使用,另一方麵,所有的投放模型都有機器學習,它可以以小時為緯度進行自我優化和迭代。
另外,我們還有非常有特色的智能定價,這個係統我想給大家解釋一下。
舉個例子,假如說我是一家銀行,我想發行我的信用卡,我要做一個活動,給用戶發紅包做利益刺激,這個紅包定多少錢?10塊錢?20塊錢?50塊錢?還是200塊錢?不知道。
可能做運營有經驗的人員就會來說,我來做一個試驗,我可以做幾個方案放到線上投放,看哪個效果最好。這麼做對不對?對。因為你做運營已經有了運營數據化驅動運營的思路了。如果說“不對”,為什麼不對?
給大家講一個段子,這是一個真事。
有一天在網上看到一個友商的高層發表了一段針對京東的評論,原話記不清了,大概是說京東真是老土,就會拿一些小恩小惠去吸引那些低端用戶,怪不得高淨值的人不跟你玩。
說實在的,剛開始看到評論我非常生氣,我覺得你這是在誤導群眾,別人不知道,你作為業內從業者還不知道?我們這個東西做過測試,小恩小惠,受眾最大,轉化率很高,成本很低,我整個的活動效果很好,為什麼要批評我?
但是,我們有一個文化,就是別人一旦批評你,不管怎麼樣你得想這裏麵一定有些問題你可以去思考、改進。
所以,我們就關起門來複盤這個案例,一複盤發現確實這裏麵有問題。活動的額度低,能拉來大量的客戶,成本不高,但你拉來的都是些低淨值的客戶,高端的客戶不跟你玩,看不上。
怎麼辦?你把你的淨值提高嘛。你辦一張卡給別人送200,這也不行。本來你用10塊錢可以買到的客戶,額外付出190塊錢的成本。
怎麼辦?所以這件事上,不管怎樣做測試都不行,不管最終的活動方案選擇的是10塊錢、20塊錢、50塊錢還是200塊錢都是錯的,那怎麼辦?
我們針對這種情況特別研發出來了最有特色的智能定價,我們可以把一個活動的方案分成很多個期間段,對每個期間段找最適合他的人群進行投放,這也是我們的活動特點。
所以綜合前麵所說的,高效的活動搭建、精準的投放、智能的定價,這就是我們來客平台的優勢。
下麵給大家看一下具體的係統界麵。這一頁是整個活動效果,整個內部係統在測試的時候,提升了25%點擊率的同時把整個獲客成本下降了20%。
在我們係統操作的界麵,可以用內置的模板非常快速的搭建一個活動,例如抽獎的活動,裏麵提供了大量豐富的利益點,可能是京東的京豆或者京東白條的免息券。
這個時候我們可以給商戶提供活動策略和針對活動的人群;如果沒有合適的,可以用我們的標簽體係快速創建一個新的適合你活動的客群。
完畢後就進入投放環節,用活動自動生成一些活動的素材,就可以把它投放出去了。
投放完成以後,大家可以看到數據,我們對於投放的渠道效果有非常完備的報表。
另外,對於活動整個的投入、產出也有詳盡的分析,這個分析不是單一以這個活動的緯度,還有與整個平台上麵所有同類活動的對比,這樣你可以看自己的活動哪些方麵會比同類好,哪些方麵有差距,需要調整。
需要強調的是,我們所有的數據都是實時的,這樣,運營人員就可以快速地根據活動投放的效果調整活動方案,不需要像從前一樣做活動要等一周,活動營銷出來之後再去調整。
看完營銷,再談一下風控。
金融行業從業人員都應該知道,風控是金融的核心能力,風控的好壞直接決定你的係統風險和你的成本。
2.智能風控
京東金融在過去幾年中所做的業務,不論是供應鏈金融,還是消費金融、個人財富、支付,都需要強大的風控能力。所以經過了幾年的沉澱,我們已經建立了一整套基於數據的完善的風控模型和體係。
這個模型有什麼特點?一句話概括,我認為這是一個個性化和群體關係的完美融合。
個性化
與傳統的機構風控相比,我們的風控從建立第一天開始就是基於大數據。也就是說,即使同樣的一個業務,不同標簽的人進來,你可能會走到不同的風控模型裏麵去,然後係統會給你不同的信用額度、給你不同的風險定價。
大家可以看到,銀行的信用卡額度基本都是整數,整千,整萬。但京東白條額度計算非常精確,到元;而且每個人的還款利率可能是有差異的,後麵所接的資產也會是有差異的,這就是我們模型個性化的地方。
群體關係
最早的風控模型都是圍繞著一個用戶本身、一筆交易本身做的,但是隨著我們的業務的發展,不管是在做授信的模型,還是在做反欺詐的模型、反洗錢的模型,我們都發現用戶的關係和交易的關係,在整個模型裏對他的計算結果影響已經越來越大了。
所以,我們的風控模型也會從最傳統的單一客戶、單一交易的單緯度模型上升為基於用戶關係鏈和交易鏈的多維複合模型,這是我們的模型的特點。
說完了基於核心技術的風控,我們來談一下我們在用戶的深度識別和反欺詐領域做的很多前沿技術的探索。
最簡單、最常見的是人臉識別,我們已經將人臉識別技術成熟應用在登錄、授信、支付、反欺詐,還有營銷的各個領域上麵。我們的人臉識別的準確度不僅行業領先,還花了大量的精力去做防攻擊。
315晚會上麵講過,人臉識別的弱點就是被攻擊、被偽造,我們的反攻擊模塊基本可以識別目前市麵上所有的已知的攻擊方法,不論你是拿一張照片還是拿一段視頻,還是像315晚會那樣拿你的臉做一個3D建模,亦或是把你的頭打印出來放到我們的係統中做測試,都沒有問題,我們都可以精準的識別並把這個攻擊蔽掉。
整個過程是完全無感的,不需要像傳統的活體識別一樣需要你配合睜眼、張嘴、做動作,這個技術跟蘋果推出的最新技術是一樣的。
除了人臉之外我們還做了很多儲備的識別技術,比如聲紋、虹膜、掌紋支付,我們在做儲備和測試。
另外,今天還想跟大家談一下我們很快就要搭載的新技術:生物探針技術。
說得簡單點,就是大家手裏都有手機,手機其實是有傳感器的,可以捕獲你的很多信息,包括你拿手機的角度、移動加速度、點擊屏幕的力度、滑動的麵積等,我們用超過120項特征去描述這個用戶的行為。
這個技術可以大量用於反欺詐,比如說機器人的攻擊在手機傳感器上是沒有這些參數的。
還有那些羊毛黨(指那些專門選擇互聯網公司的營銷活動期間,以低成本甚至零成本換取高額獎勵的人),可能一個人在那裏點擊幾十台手機,他這時的使用習慣明顯跟正常人是不一樣的,這樣生物探針技術都可以識別出來。
更進一步的是,我們現在做的是本人的識別,同樣一台設備自己在使用的時候和交給你的朋友使用,習慣是不一樣的,哪怕就是一個短短的6位密碼的習慣都可以識別出來。
這有兩方麵好處:
一方麵,對真正的用戶本人,可以很大的提升體驗。你不需要經曆整個支付過程,因為係統要對你進行健全,識別你之後,支付密碼、支付驗證就都不需要了。
另一方麵,對於非本人用戶,即使你拿到別人的手機,從機主嘴裏把支付密碼騙出來,也沒有用,我們可能會給你加驗,說我們還是看一看你的人臉吧,看你到底是不是本人,這樣可以最大限度的保護我們的用戶資產的安全。
與營銷平台的“來客”一樣,我們會把我們的風控能力包裝成一個產品,叫“安全魔方”,裏麵會標配很多針對金融場景有需求的風控模式,並且部署方式也很靈活,這樣我就可以更好的和我的合作夥伴一起把整個的風控水平進行提升。
有關金融雲的內容很多,今天沒有辦法一一展示。
最後,引用劉總在整個生態建設中用的三個詞,那就是“共生、互生和再生”。我希望京東金融能夠有機會更多金融機構一起互相支持、互相幫助,為整個金融行業的發展和突破貢獻一份力量。
謝謝大家!
一篇不過癮,京東筆記打包大放送
最後更新:2017-11-07 07:18:01