結合AlphaGo算法和大數據的量化基本麵分析法探討

◆ ◆ ◆
序
本文是以郝伯特·西蒙的過程理性理論結合AlphaGo算法步驟探討量化基本麵分析法的分析方式,而不是討論如何使用量化基本麵分析法預測公司股價。
量化基本麵分析法(Quantamental)將量化和基本麵兩種方法結合起來,是近幾年隨著市場電子化、大數據、自然語言處理技術快速發展產生的新的基本麵分析法。現在已經是DT時代,發揮海量數據價值已成為可能。以下討論都是假設已合法的收集相關數據包括交易、消費、關注度、GPS、衛星數據等等。
◆ ◆ ◆
一、基於大數據的量化基本麵分析法的預測更準確嗎?
一般來說,我們會將整個經濟看作一個大的動態市場係統,其中又會分割為一些子市場係統,可以認為每一個子市場係統中參與方與相關變量彼此之間的聯係要比其他子係統中變量的聯係要更強些。所以每個子市場係統中的參與方以及變量獨立於其他子係統相對均衡動態移動。短期均衡及每個子係統顯著主導的行為往往是波動而不可預期的。但長期動態均衡往往是可預期的,雖然每個子係統中的變量一起動態移動,但保持了每個子係統間的相對均衡。從微觀角度考慮的時候現象是變化的,而從宏觀角度考慮時,現象是不變的。現在基於之前的數據假設,我們有了關於各個子市場係統方方麵麵的數據,自然可以更好地統計長期動態均衡中那些穩定的關係,從而得到更加可靠的基本麵分析結果。
但與此同時,我們也能聽到另一種聲音。在《信號與噪聲》[1]書中,作者認為在大數據時代信息量呈指數增長,需要驗證的假設也正在以同樣的速度增長。數據中那些有意義的因果關係組合少之又少,增長的速度也不及信息本身的增長速度快。大多數數據都隻是噪聲。人們很難從幹擾他們的噪聲中分辨出有用的信號。數據展示給我們的通常都是我們想要的結果,而且我們通常也默認這種皆大歡喜的結果。作者納特•西爾弗還引用莎士比亞劇作中的話“人們照著自己的意思解釋一切事物的原因,實際上卻和這些事物本身的目的完全相反”。更大量信息能幫助我們更準確的預測嗎?
當然我們知道,通過深度學習和大數據,一定能得到一個更優的模式識別效果。但前提是我們假設未來和曆史特征向量是符合同一概率分布。未來當然不會和曆史是同一概率分布,就像彼得·林奇說的“你無法從後視鏡中看到未來。”哈耶克也說過“我們做出的預測有可能被否定,因為他們隻具有經驗的意義。”這裏也不想用深度學習成果來證明大數據在預測方麵的效用。
納特•西爾弗在其書中接下來說:”信息隻有在恰當的環境下才會成為知識,沒有環境,我們就無法從噪聲中區分信號,不斷犯錯,不斷嚐試,這或許是貝葉斯定理應用起來最容易的一個原則:進行大量的預測。”[1]”貝葉斯定理告訴我們,任何時候獲得新信息,我們都應該更新自己的預測。簡單地說就是,不斷犯錯,不斷嚐試。真正’擁有’大數據的公司,比如穀歌公司,並不會在建立模型的問題上花費太多時間。它每年會進行上千次實驗,並在真正的客戶身上檢驗它的想法。”[1]在穀歌等互聯網公司都會有完善AB測試框架,以方便不同功能快速部署AB測試,通過客戶使用效果反饋不斷迭代完善功能。我們知道AB測試本質上是個分離式組間實驗,不斷獲取客戶反饋既新信息持續優化模型效果。同樣我們可以認為基於大數據的量化基本麵分析法,不隻是用大數據補充之前基本麵分析法所用數據不足,其也是通過量化和更及時的數據不斷修正預測模型的過程。
◆ ◆ ◆
二、 基於過程理性的量化基本麵分析法
接下來,將以郝伯特·西蒙的過程理性理論結合AlphaGo算法步驟探討量化基本麵分析法的步驟[2][3]:
1.設想可選方案集合,以及可能後果集合。
還是基本麵分析法經常需要分析的那些問題,包括上下遊、銷量、成本、利潤、財務比率等。設想不同預測值下的可選方案與可能後果。
2.評估可能後果集合的概率。
以上兩步,過程理性和貝葉斯定理要求基本一致。都需要基於曆史統計得到各可選方案的概率。這種預測被稱作“初始觀點”。”從理論上講,我們希望將初始觀點建立在過去的經驗最好是社會經驗的集合之上。”[1]
3.改進預測的數據,獲得新數據,從而改進預測模型。
新信息和原有信息結合起來的理性過程也是應用了貝葉斯定理。同樣,基於大數據的量化基本麵分析法可以更及時的收集最新數據以及結果反饋來改進預測模型。
4.預測模型結果將會影響可選方案集合,以及可能後果集合,從而持續優化決策過程。
持續優化的預測模型,即是一個預期過程,可以進一步減少不確定性以及消剪了行動域即可選方案集合。這點本質上也是緩衝預測誤差影響,和量化中動態對衝,不斷調整風險敞口的方式是一致的。
5.從可能後果集合中,根據預期目標,選擇滿意的可能後果集合子集。並從可選方案集合中得到滿意的可能後果集合子集對應的方案。
在AlphaGo中使用蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS)結合估值網絡(Value Network)來做可選方案集合選取。其決策時也可以認為是符合過程理性的。比方AlphaGo會走一步導致贏麵更小,但贏的概率更大的棋。這太不優雅了,但修改對局勢的期望,減少了搜索時的空間。
而投資人、分析師會基於之前的經驗與直覺做這個決策。依托的是人類的長期記憶和人類個體和集體的學習能力。納特•西爾弗也認為從噪聲中區分信號既需要科學知識,也需要直覺,那是基於人類長期記憶的。郝伯特·西蒙對比過國際象棋世界冠軍十年間不同的下法,認為這是這是全部職業強選手的集體經驗而積累起來的知識的結果。專家和新手區分不僅僅是前者具有大量和多樣的信息,而且是他的直覺經驗使他能發現他所麵對的形勢中的熟悉模式,長期記憶中儲存大量的棋子的共同模式,通過識別這些模式,從長期記憶中重新找到大量相關信息。
不論如何,這是一個過程決策,正如郝伯特·西蒙強調的“抉擇不是由問題的客觀特征所唯一確定的,而是取決於用來達到決策的啟發式過程。”[2]
◆ ◆ ◆
三、結論
基於大數據的量化基本麵分析不隻是彌補了公司季報時間上空白,也不隻是通過方方麵麵的數據提供更多特征得到更好的基本麵分析預測結果。其本身也是一個符合過程理性的分析方式。介於其也是隨著大數據的發展剛剛起步的新的分析方法,如何不斷借鑒量化、基本麵分析法、大數據、機器學習等各方麵的成果還有待進一步探討。就像黃霑歌詞裏寫的“論武功 俗世中不知邊和高 或者 絕招同途異路”。
原文發布時間為:2016-11-25
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
最後更新:2017-05-31 11:31:57