閱讀326 返回首頁    go windows


摩根大通機器學習與金融大數據指南——未來的華爾街大亨|大數據+機器學習+金融工程師

首發地址:https://yq.aliyun.com/articles/93512

https://yq.aliyun.com/cloud

215ad55f60f503bec0ad56ab7c2b49538f252702

金融服務工作流行得快、過時得也快。2001風靡一時;2006CDOs有著偏愛;2010信貸交易商很受歡迎2014又輪到了合規專家;而2017的時代,如果你能涉足該領域那麼你的未來將會有所保證

J.P.Morgan的定量投資和衍生策略團隊發布了關於金融服務領域大數據和機器學習的最全麵的報告報告稱,大數據和人工智能AI戰略機器學習和另類數據投資方式機器學習將對未來市場運作至關重要分析師投資組合經理交易員和首席投資官都需要機器學習技術熟練掌握如果不這樣做,那麼就會被淘汰像季度收益GDP傳統數據源將變得越來越不相關這是因為使用更新的數據集和方法的管理人員能夠提前預測,並在發布之前就完成交易。

由於280報告太長無法詳細介紹,現總結一些突出的觀點。

1. 

摩根警告銀行和金融公司優先考慮基於市場知識的數據分析技能的方式,這樣做是相當危險的,而了解數據和信號背後的經濟學比開發複雜的技術解決方案更為重要

2. 

摩根指出,人類已經被排除在高頻交易之外。未來,機器在中期交易中也將越來越普遍:機器有能力快速分析新聞消息和推文處理收益報表、挖掘網站和瞬時交易,這將有助於削弱多基礎分析師長短期股票管理者和宏觀投資者需求。

3. 

   長期來看,人類保留的一個優勢就是對製度的把握及人類反應的預測比機器做得更好,這些預測涉及解讀諸如政治家和央行行長複雜的人類反應、了解客戶定位或預期擁擠等。如果你想作為一個人類投資者生存下去,那需要打造出自身的優勢

4. 

在實施機器學習策略之前,數據科學家和定量研究人員需要獲取數據並對其分析以獲得可交易信號和深刻見解。

數據分析很複雜今天的數據集通常比昨天的數據更大,這些數據集可能包括個人(社交媒體帖子產品評論搜索趨勢等)業務流程(公司廢氣數據商業交易信用卡數據等)和傳感器(衛星圖像數據交通、輪船定位等)生成的數據數據很少呈現出幹淨的內容,無法直接提供給機器學習算法使用,因此需要專門的團隊預處理數據後才能在交易策略中使用。另外還需要評估alphaAlpha依賴於數據的成本所需的處理量以及數據集的使用情況。

6d6cfc0f3cc0b4fb762eb9a2abcad1da02316a2c

5. 

機器學習有多種迭代算法,包括監督學習無監督學習以及增強學習

監督學習的目的是建立兩個數據集之間的關係,使用一個數據集預測另一個數據集無監督學習目的是嚐試了解數據的結構並確定其背後的主要驅動力學習的目的是使用多層神經網絡來分析一個趨勢,而增強學習則鼓勵算法來探索和找到最有利可圖的交易策略。——

1f8d94d680cc6cae1ef31a5fe74075c8695fdd41

6. 

在財務背景下,摩根表示,監督學習算法根據提供的曆史數據找出最佳預測關係。一般來講,有監督學習算法有兩:回歸和分類

  • 基於回歸的監督學習方法嚐試基於輸入變量來預測輸出。
  • 分類方法逆向操作,並嚐試確定一組分類屬於哪個類別。

7. 

在無監督學習中,機器從大量變量中獲得回歸,並且不知道哪些是依賴和獨立變量。概括來講無監督學習方法被歸為聚類或因子分析

  • 聚類基於一些相似性概念將數據集分成較小的組。
  • 因子分析旨在識別數據的主要驅動因素或確定數據的最佳表示。在資產投資組合中,因子分析將確定動力、價值等主要驅動因素。

8. 

深度學習實際上是人為重建人類智慧的一種嚐試。摩根表示,深度學習特別適用於非結構化大數據集的預處理(例如,可用於統計衛星圖像中的汽車數、或在新聞稿中識別情緒)。深度學習模型可以使用假設的財務數據係列來估計市場調整的可能性

深度學習方法基於神經網絡,這些神經網絡類似於人類大腦的神經網絡。在網絡中,每個神經元接收來自其他神經元的輸入,並且計算這些輸入的加權平均值不同輸入的相對權重取決於以往的經驗,一層連接一層,網絡層數越高,學習到的特征越抽象

595b0df099fb69a24f54797169f23ea73d191e56

9. 

增強學習的目標是選擇一係列連續的行動以最大化最終(或累積)獎勵,這與監督學習(通常一步過程)不同,增強學習模型並不清楚每個步驟的正確操作

摩根的電子交易部門已經增強學習開發了一些算法下圖顯示了銀行機器學習模型(懷疑是故意模煳)。

d2e07861640f8b517db549ebfebb73c13c5c3bf7

10. 

摩根表示,數據科學家所要求掌握的技能與定量研究員幾乎相同。因此,有著計算機科學統計學數學金融工程計量經濟學和自然科學背景的買方和賣方都能重新塑造自我。量化交易策略將是關鍵技能,這是由於量化研究者IT/采用更好的統計和機器學習工具。

另外不需要知道機器學習的詳細細節,這是因為大多數機器學習方法已經被編程,你隻需要應用現有的模型。作為新手WekaPythonKeras這樣豐富的庫,以及Tensorflow

fdad0822b4296a15d36e44c5b37b4f2c98e9bc5d

11. 

如果隻R語言以及對應數據C ++Python對應的機器學習應用程序。

8220f3ec0633502c674129dc8f07a39342e4ea64

65704c453b6b931b003df8706c71883173813a00

4a1b734f65c9eaf9e5e1da83842256bb16c893d0

12. 

78477232ba629ab4ae7b54301196159154e62dd9

887bb50d5e19674ab2fe0a8a5e82137773940d18

f448d08691a8e6bcea81687b3246621ae032d43a

13. 

也需要了解大數據。報告指出,多招聘人員和招聘經理無法區分人工智能和實際設計可交易策略的這種能力,合規團隊還需要能夠審查機器學習模型以確保數據被正確地匿名化金融領域的機器學習時代已然來臨,那些不學習、拒絕進化的人將麵臨過時的風險。分析師投資組合經理、交易和首席信息官最終將不得不熟悉大數據和機器學習的發展和相關的交易策略。

Sarah ButchereFinancialCareers特約作家畢業於英國牛津大學,對銀行金融業感興趣

Linkedinhttps://www.linkedin.com/in/sarahbutcherjournalist/?ppe=1

Twitterhttps://twitter.com/MadameButcher

本文由北郵@老師推薦,阿裏雲雲棲社區組織翻譯。

J.P.Morgan’s massive guide to machine learning and big data jobs in financeSarah Butcher,譯者:海棠,審閱:東東邪

pdf

文章為簡譯,更為詳細的內容,請查看

最後更新:2017-07-12 22:12:00

  上一篇:go  幹貨|大神教你如何參加kaggle比賽——根據CT掃描圖預測肺癌
  下一篇:go  七招教你處理非平衡數據——避免得到一個“假”模型