阅读220 返回首页    go 阿里云 go 技术社区[云栖]


快速选择合适的机器学习算法

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud


“我应该使用哪种算法?”问题的答案取决于许多因素,包括:

  • 数据的大小、质量和性质。
  • 可用计算时间。
  • 任务的紧迫性。


机器学习算法速查表

8cd0e819adc727d3cd7bd02725ca348eb7f17e5b

“如果





  • 回归:当预测连续值时,问题变成一个回归问题。



agent

逻辑

2368207df9f66e6bebae7bec9af6c9d77a298c7a
0d0925e6f343fe2b85e1d401702cfdae540afea5



y之间的关系可以线性建模为4e18a198a7d6f5e7f7a7908a0a6acf4fc6399e89。根据训练样本9b5d4693352cb9c7488b7d98660d0aad931c200dβ。

logit链接函数将线性回归转换为逻辑回归。 逻辑回归是一种简单,快速而强大的分类算法。 这里我们讨论二进制的情况,其中因变量y只取二进制值0c778e6df6e6ecbdc75683900a6707f98ac888ed

“1”类的概率,而不是它属于“-1”类的概率。 具体来说,我们将尝试学习以下形式的函数:7ef6dc857c4130af7e7593a9f3dfbaf86268ad74edb689aa2dcd3440d76a84ec82a730298010144e467ffff444e4b3b66029eb2adefbc85d9ce1212asigmoid函数。给定训练样例535b5d837f9156eddfd04feed8bfdafca45a69f3,可以通过使给定数据集β的对数似然度最大化来得知参数向量β。

9d8ae980ab5d38322e973d31c836e0019e43fa24

9e20d3dfe9c61fe8f8925ffd0122aac75dbbdd52

SVM

84bb2e0d4c58ddf6b076cd8456470c393d7e9c53

cf6f2234a428f8ffda012ffd93dd49cde2ecca88

树和集成树

87a92df4a53445b387f066981975aa863285a2ff

神经网络和深度学习

049396d28d9afccb929cb16c13af4ed69ab14657

换句话说,浅层神经网络已经演变成深度学习神经网络。 深层神经网络对于监督学习已经非常成功。 当用于语言和图像识别时,深层次的学习表现与甚至比人类更好。 适用于非监督的学习任务,如特征提取,深度学习还从原始图像或语音中提取少量人为干预的特征。

4c3655ee479296a718d508781d039f3a8806281d

K-means/ K-modes

663c4b51f789dee2bee96a2e099080caf1182ae3
5f7a0639c4fa2925f1037f644e96ad5fc8c570af

K-means/ K-modes,GMM聚类旨在将n个观察值分为k个集群。 K-means定义硬分配:样本将是且仅与一个集群相关联。 然而,GMM为每个样本定义一个软分配。 每个样本具有与每个集群相关联的概率。 当给定集群k的数量时,两种算法都是简单且足够快的聚类。

DBSCAN

6f2d45485749de7912c1b06742382bc07b495e7f

分层聚类

dc049bb829b807507eaced6c57d76eac9194e186

PCA, SVD

  • 定义问题。你想解决什么问题?

SAS视觉数据挖掘和机器学习为初学者学习机器学习和应用机器学习方法提供了一个良好的平台。


309439dee90dd521f0f0ef23096ed4787c0694a3


以上为译文

@爱可可-爱生活阿里云云栖社区

Which machine learning algorithm should I use?,作者:Hui Li,译者:tiamo_zn,审校:。

文章为简译,更为详细的内容,请查看原文

最后更新:2017-05-21 23:01:29

  上一篇:go  分布式存储系统
  下一篇:go  PostgreSQL 锁等待监控 珍藏级SQL - 谁堵塞了谁