閱讀220 返回首頁    go 阿裏雲 go 技術社區[雲棲]


快速選擇合適的機器學習算法

更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud


“我應該使用哪種算法?”問題的答案取決於許多因素,包括:

  • 數據的大小、質量和性質。
  • 可用計算時間。
  • 任務的緊迫性。


機器學習算法速查表

8cd0e819adc727d3cd7bd02725ca348eb7f17e5b

“如果





  • 回歸:當預測連續值時,問題變成一個回歸問題。



agent

邏輯

2368207df9f66e6bebae7bec9af6c9d77a298c7a
0d0925e6f343fe2b85e1d401702cfdae540afea5



y之間的關係可以線性建模為4e18a198a7d6f5e7f7a7908a0a6acf4fc6399e89。根據訓練樣本9b5d4693352cb9c7488b7d98660d0aad931c200dβ。

logit鏈接函數將線性回歸轉換為邏輯回歸。 邏輯回歸是一種簡單,快速而強大的分類算法。 這裏我們討論二進製的情況,其中因變量y隻取二進製值0c778e6df6e6ecbdc75683900a6707f98ac888ed

“1”類的概率,而不是它屬於“-1”類的概率。 具體來說,我們將嚐試學習以下形式的函數:7ef6dc857c4130af7e7593a9f3dfbaf86268ad74edb689aa2dcd3440d76a84ec82a730298010144e467ffff444e4b3b66029eb2adefbc85d9ce1212asigmoid函數。給定訓練樣例535b5d837f9156eddfd04feed8bfdafca45a69f3,可以通過使給定數據集β的對數似然度最大化來得知參數向量β。

9d8ae980ab5d38322e973d31c836e0019e43fa24

9e20d3dfe9c61fe8f8925ffd0122aac75dbbdd52

SVM

84bb2e0d4c58ddf6b076cd8456470c393d7e9c53

cf6f2234a428f8ffda012ffd93dd49cde2ecca88

樹和集成樹

87a92df4a53445b387f066981975aa863285a2ff

神經網絡和深度學習

049396d28d9afccb929cb16c13af4ed69ab14657

換句話說,淺層神經網絡已經演變成深度學習神經網絡。 深層神經網絡對於監督學習已經非常成功。 當用於語言和圖像識別時,深層次的學習表現與甚至比人類更好。 適用於非監督的學習任務,如特征提取,深度學習還從原始圖像或語音中提取少量人為幹預的特征。

4c3655ee479296a718d508781d039f3a8806281d

K-means/ K-modes

663c4b51f789dee2bee96a2e099080caf1182ae3
5f7a0639c4fa2925f1037f644e96ad5fc8c570af

K-means/ K-modes,GMM聚類旨在將n個觀察值分為k個集群。 K-means定義硬分配:樣本將是且僅與一個集群相關聯。 然而,GMM為每個樣本定義一個軟分配。 每個樣本具有與每個集群相關聯的概率。 當給定集群k的數量時,兩種算法都是簡單且足夠快的聚類。

DBSCAN

6f2d45485749de7912c1b06742382bc07b495e7f

分層聚類

dc049bb829b807507eaced6c57d76eac9194e186

PCA, SVD

  • 定義問題。你想解決什麼問題?

SAS視覺數據挖掘和機器學習為初學者學習機器學習和應用機器學習方法提供了一個良好的平台。


309439dee90dd521f0f0ef23096ed4787c0694a3


以上為譯文

@愛可可-愛生活阿裏雲雲棲社區

Which machine learning algorithm should I use?,作者:Hui Li,譯者:tiamo_zn,審校:。

文章為簡譯,更為詳細的內容,請查看原文

最後更新:2017-05-21 23:01:29

  上一篇:go  分布式存儲係統
  下一篇:go  PostgreSQL 鎖等待監控 珍藏級SQL - 誰堵塞了誰