閱讀780 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《構建實時機器學習係統》一1.5 實時機器學習的分類

1.5 實時機器學習的分類

按照實際應用中采用的方式不同,實時機器學習可以分為硬實時、軟實時和批實時三種模式,下麵將分別進行介紹。

1.5.1 硬實時機器學習

硬實時的定義是:響應係統在接收到請求之後,能夠馬上對請求進行響應反饋,做出處理。硬實時機器學習的主要應用場景是網頁瀏覽、在線遊戲、高頻交易等對時效性要求非常高的領域。在這些領域中,我們往往需要將相應延遲控製在若幹毫秒以下。對於高頻交易等場景,更是有不少計算機軟件、硬件專家,開發出了各種專有模塊以在更短的時間內完成交易,獲得超額利潤。
在本書寫作之時,計算機網絡的傳輸速度仍然是響應延遲的一大主要因素。硬實時機器學習的響應架構往往會試圖盡量減少請求處理過程中的網絡傳輸步驟。與此同時,為了達到硬實時的要求,在請求突然增加的時候,往往會采取負載均衡的方法,靠增加服務器的數量來減少響應延遲。

1.5.2 軟實時機器學習

軟實時的定義是:響應係統在接收到請求的時候,立即開始對響應進行處理,並且在較短時間內進行反饋。軟實時機器學習隻要求係統立即對請求開始進行處理,最後處理完成所消耗的時間比較少,但是要求不如硬實時嚴格。軟實時機器學習的主要應用場景是物流運輸、較為頻繁的數量金融交易等領域。例如某物流企業在接到訂單之後需要對運輸時間、物品風險進行預估,其中需要和多個係統服務進行交互讀取,這個時候我們需要係統能夠實時地做出處理,但是處理結果可能需要經過數秒才能得到。
由於軟實時機器學習對響應延遲的要求有所放鬆,因此往往會在處理架構中加入分布式隊列這一組成部件。處理的任務會被實時地傳輸到分布式隊列中,而後端的處理程序能響應式地對任務進行處理。與此同時,在請求增加的時候,可以通過分布式隊列緩衝到達的任務,也可以通過負載均衡的方法增加處理單元,以保證低延遲。

1.5.3 批實時機器學習

硬實時機器學習和軟實時機器學習都是針對具體的單個事件進行處理。與此相對應的,批實時機器學習是指對成批到達的數據進行實時的處理。批實時機器學習的應用場景往往處於後端機器學習模型的訓練和數據處理加工上。通過實時訓練的模型將會被部署到硬、軟實時機器學習架構中,對數據進行處理。
由於批實時機器學習需要對一定時間窗口內的所有數據進行處理,因此批實時機器學習架構中往往也會有一個分布式隊列,對時間窗口內的數據進行緩衝和加工。在數據流向增加的時候,可以通過加大分布式隊列的容量,提高分布式隊列的處理能力;也可以通過增加處理單元的方法來提高處理能力,以保證低延遲。

最後更新:2017-09-19 10:03:35

  上一篇:go  《構建實時機器學習係統》一1.7 案例:Netflix在機器學習競賽中學到的經驗
  下一篇:go  在土耳其,他是阿裏唯一的員工