閱讀184 返回首頁    go 阿裏雲 go 技術社區[雲棲]


用炸彈開路——加速到來的證券投資行業人工智能時代

去年開始涉足人工智能技術應用於證券投資領域的研究,將近兩年的研究實踐,發現公開資料上很多關於人工智能(AI)對證券投資業發展影響的文章都存在幾個明顯的思維誤區:①一個是對人工智能的認識有誤。人工智能是個廣域籠統的概念,但基石是機器學習,以機器學習算法構建邏輯和規則為基石的人工智能與自動化程序軟件及通過數據回測構建起來的以固定邏輯運行的量化投資模型是完全不同的事物,區別就好比活雞和模型雞,需要明白自動化軟件不是人工智能,國內大多數所謂智能投顧其實還不是真正意義上的人工智能投顧;②另一個是曲解了人工智能在證券投資行業的應用。簡單地理解為通過采樣數據及數據處理尋找特定的因果聯係,進而“預測”(基於概率統計推導)標的物價格漲跌及給出“最優”(基於某種量化指標的數據值)的投資建議。這本質上還是自動化程序軟件幹的事,和人工智能機器學習算法扯不上多大的關係;③再一個是將人工智能無限神化。認為人工智能在證券投資行業所到之處必摧枯拉朽所向披靡,產生絕對的高維度碾壓低維度的優勢。證券投資是一項多層次結構的係統工程,能夠決定投資成敗的不是單一因素而是全局架構,人工智能隻能盡可能多的在某些領域和環節發揮一些人無法企及的超常規作用,但是也有很多領域和環節是其無法涉足的,人有發散性思維的能力,而機器的思維始終都是線性的。人工智能本質上還是工具,還是被人馭著耕田的牛,人工智能在證券投資行業發揮多大作用核心還是看人的思維,人把它用在哪裏以及怎麼用。你騎著耕牛去插秧,不光你尷尬,牛也挺尷尬。④最後一個是認為人工智能實戰應用於證券投資行業還很遙遠。這個世界永遠有人起得比你早,永遠有人睡得比你晚,就好比N年前期貨市場量化交易一樣,當你還在努力弄明白什麼是量化投資的時候,起得早的人早已經在量化投資領域功勳卓著了。在我們能力所及的認知覺範疇,人工智能實戰應用於證券投資領域已經不少於10年了,國內最早一批成功應用人工智能技術輔助證券投資的機構,基本是和雲計算同步出現的,其績效也不是傳統的量化交易模式可以比擬的,這個市場有很多“暗網”性質的應用現代投資工具的技術團隊,你很難在公開的資料中查到他們的相關信息,但績效卻十分驚人。還是上麵提到的,人工智能在證券投資領域的全局應用暫時還實現不了,因為證券投資是個多層次結構的係統工程,和圍棋這種雙方博易的事物不同,形象地講,人工智能在證券投資領域以完整機器人形態出現還不現實,目前還是以機械假肢、機械外骨骼、心髒起搏器、助聽器等輔助形式存在,即便是這種局部環節的作用存在,對這個行業產生的影響都是十分巨大的。 我們過去兩年的研究一直停留在理論研究和算法構建的層麵,正真走向台前,理論落地也是在最幾個月,尤其是阿裏雲支持非結構數據計算的“數加·MaxCompute9月香港市場上市開服,才讓真正意義上的低成本超級計算成為現實,以前民營技術公司想要低成本應用超級計算門都沒有, MaxCompute不光提供計算力,還提供通用的人工智能算法,還提供了如“CPU+GPU”,“CPU+FPGA”等異構運算模式,能夠更適合深度學習、金融分析等計算密集型領域,比傳統CPU並行計算更高效,能用1小時的時間解決傳統CPU運算幾十天才能解決的問題,還簡單易用,你隻要有數據和想要利用這些數據實現的目標就行了,最可恨的是成本極低沒有門檻,隻要有足夠天賦,6歲小孩都可以成為人工智能的大神。馬雲有酒還有開瓶器和杯子,你有故事就來!正真應了那句話,未來是我們的,也是你們的,但歸根結底是那些活得久活的好的人的,而那些人的世界最終還是馬雲爸爸創造的。

0d3c13eb63bdac0ddb02195240a167710c39b7b2


正是因為看到了人工智能三個核心要素——數據+算法+計算力在當下的中國都已經不是問題,我們才驚恐地意識到人工智能產業大爆發會比我們想象中的要來的更早,才真正明白了百度李彥宏的人工智能戰略以及2017年作為人工智能爆發年的原因。我們也看到了金融領域技術創新的嚴重滯後,強烈利益導向的證券投資行業將不可避免地迎來真正的“野蠻人”,不管你信不信,騎著人工智能這頭瘋牛的“野蠻人”會再造我們這個市場的生態,可能還容不得你仔細思考,量化時代就一步邁進人工智能時代了。

c3e0afba311e50c49ef95307d4749de94f32ac4e

 

關於人工智能,有一個經典的機器學習算法認識貓的的案例。你不用告訴機器學習算法什麼是貓,算法也不會問你貓的定義,你隻需要給它大量的100%是貓與100%非貓的各種形式的數據,算法依據一些既定的規則在這些數據中構建邏輯。當算法接觸到第10組數據訓練的時候,它可能會把一片草地定義為貓,因為它在前十組數據中發現了草地是顯著的共性特征,當機器學習算法接觸到第100組數據訓練的時候,它可能會把駱駝定義為貓,因為它排除了草地是貓的可能但區分不了同樣是四條腿,駱駝和貓有什麼不同,當接觸到第10000組數據訓練的時候,它能依托之前數據訓練中構建起來的邏輯對不同品種不同姿態的貓精準識別,當接觸到第1000000組數據的時候,它將一種貌似兔子實則為貓的動物準確地定義為貓,而你卻隻能憑著經驗和主觀將它定義為兔子,當算法接觸到第1000000000組數據訓練的時候,它準確且毫不猶豫地將一隻誕生在火星上的基因再造貓排除在了貓定義的範疇之外,因為他的邏輯中形成了一種人類無法理解的哲學和倫理,在外星球誕生,沒有曆經幾十億年漫長生物進化的這種生命,到底還是不是我們所定義的貓?這個問題足夠人類爭論100年而莫衷一是的了。從某種意義上講,可能以機器學習算法為基石的人工智能對這個世界的認識才是更加真實的。

7c8dd0215bc20b5e2530380083e625c8a34c5de2


把證券投資領域AI機器學習算法所要處理的問題限定在一個有限的空間,在簡單的初設目標下通過海量數據來訓練算法,類似於阿爾法狗圍棋博弈算法的運作模式,一個行之有效的動態交易規則算法是非常有可能被創造出來的。中國有一個特點是人多,證券市場交易數據量比較大,即便是現代意義上的證券市場產生發展也才不到30年的時間,但是我們的交易數據一點都不比美國這種成熟的證券市場少,在AI所應用的金融領域,中國跟美國是可以站在同一條起跑線上的。

cab266b011bc25648bbb038bf6e6ee601475a00e


你不用告訴機器學習算法怎麼賺錢,算法也不會問你怎麼賺錢,你隻需要給它大量的相同交易規則但不同標的的三維(價格、時間、成交量)交易數據(取樣自真實股票市場環境),算法第一步是給這些數據標注賺錢交易和非賺錢交易的標簽,第二步是依據一些既定的規則在這些數據中基於特定目標構建邏輯,比如:我們給算法的既定規則是:一筆交易由進場和>=T+1離場兩個動作完成,正價差定義為盈利,0價差及負價差定義為非盈利,盈利隻有流動性邊際沒有膨脹邊際,非盈利有塔縮邊際;定義有效價格及時間內進場、離場為一個策略的基本平麵要素,平麵要素基礎上增加標的組合(資金分配)要素構成立體模型,定義模型的三個指標要素——成功率、盈虧比、周轉率,三者在固定交易成本及交易可有效執行的條件下可以動態匹配,讓算法在大量的交易數據中強化盈利訓練生成機器學習邏輯,第二階段讓算法拋開交易數據,在連續的行情數據中依托之前形成的盈利邏輯自主進行在初始資金塔縮邊際和流動性條件約束下(風險控製前置+交易可執行)以績效為目標的動態反饋的盈利交易規則構建及優化,這裏已經比較類似於圍棋的博弈了。用各種定義和規則使證券投資這種多層次多維度發散性的廣域問題龜縮到了一個收斂性的可以用人工智能機器學習算法有效應對的範疇,也就是說不再讓人工智能告訴你如何成佛這種發散性問題,而隻是告訴你每一個當下念哪一句經不會成不了佛。

f1cb8458226955c017c035cbec296487df27295f

 

我們用這種機器學習算法構建了多個智能交易規則,隨著交易數據的不斷擴充,這些智能交易規則會愈加強悍。實際應用中,我們將運算服務器生成的規則數據導入到傳統報價軟件的界麵形成可視化模型,最後驚奇地發現,算法給出的高績效交易規則模型居然無一例外全是強勢短線模式(也可能是小周期交易數據充分的原因導致的),從而側麵證實了市麵上一些主觀交易的成熟模式。我們在公眾微信平台演示公測了部分模型並持續跟蹤其績效,如PATH*AI模型,你會發現,之前你對交易的理解和認識很多時候都是膚淺的,就好比機器學習算法可能更理解貓一樣,機器學習算法可能也更懂交易,在智能算法麵前,我們不得不承認自己對交易認識的局限性和不足。

dcb87a9e804e9cce5f7337173f7e44f84a7d76b1

文章原地址


阿裏巴巴大數據-玩家社區 https://yq.aliyun.com/teams/6/

---阿裏大數據博文,問答,社群,實踐,有朋自遠方來,不亦說乎……

bba01b493e1c5d904e882b1c380673c6ebe49a98

最後更新:2017-10-10 16:34:18

  上一篇:go  研究人員采用心律進行持續身份驗證
  下一篇:go  介紹一位分布式流處理新貴:Kafka Stream