快速選擇合適的機器學習算法
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
“我應該使用哪種算法?”問題的答案取決於許多因素,包括:
- 數據的大小、質量和性質。
- 可用計算時間。
- 任務的緊迫性。
機器學習算法速查表

“如果
“
-
- 回歸:當預測連續值時,問題變成一個回歸問題。
-
agent
邏輯
y之間的關係可以線性建模為。根據訓練樣本
β。
logit鏈接函數將線性回歸轉換為邏輯回歸。 邏輯回歸是一種簡單,快速而強大的分類算法。 這裏我們討論二進製的情況,其中因變量y隻取二進製值
“1”類的概率,而不是它屬於“-1”類的概率。 具體來說,我們將嚐試學習以下形式的函數:是sigmoid函數。給定訓練樣例
,可以通過使給定數據集β的對數似然度最大化來得知參數向量β。
SVM
樹和集成樹
神經網絡和深度學習
換句話說,淺層神經網絡已經演變成深度學習神經網絡。 深層神經網絡對於監督學習已經非常成功。 當用於語言和圖像識別時,深層次的學習表現與甚至比人類更好。 適用於非監督的學習任務,如特征提取,深度學習還從原始圖像或語音中提取少量人為幹預的特征。
K-means/ K-modes
K-means/ K-modes,GMM聚類旨在將n個觀察值分為k個集群。 K-means定義硬分配:樣本將是且僅與一個集群相關聯。 然而,GMM為每個樣本定義一個軟分配。 每個樣本具有與每個集群相關聯的概率。 當給定集群k的數量時,兩種算法都是簡單且足夠快的聚類。
DBSCAN
PCA, SVD
- 定義問題。你想解決什麼問題?
SAS視覺數據挖掘和機器學習為初學者學習機器學習和應用機器學習方法提供了一個良好的平台。
以上為譯文
Which machine learning algorithm should I use?,作者:Hui Li,譯者:tiamo_zn,審校:。
文章為簡譯,更為詳細的內容,請查看原文
最後更新:2017-05-21 23:01:29