快速选择合适的机器学习算法
更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud
“我应该使用哪种算法?”问题的答案取决于许多因素,包括:
- 数据的大小、质量和性质。
- 可用计算时间。
- 任务的紧迫性。
机器学习算法速查表

“如果
“
-
- 回归:当预测连续值时,问题变成一个回归问题。
-
agent
逻辑
y之间的关系可以线性建模为。根据训练样本
β。
logit链接函数将线性回归转换为逻辑回归。 逻辑回归是一种简单,快速而强大的分类算法。 这里我们讨论二进制的情况,其中因变量y只取二进制值
“1”类的概率,而不是它属于“-1”类的概率。 具体来说,我们将尝试学习以下形式的函数:是sigmoid函数。给定训练样例
,可以通过使给定数据集β的对数似然度最大化来得知参数向量β。
SVM
树和集成树
神经网络和深度学习
换句话说,浅层神经网络已经演变成深度学习神经网络。 深层神经网络对于监督学习已经非常成功。 当用于语言和图像识别时,深层次的学习表现与甚至比人类更好。 适用于非监督的学习任务,如特征提取,深度学习还从原始图像或语音中提取少量人为干预的特征。
K-means/ K-modes
K-means/ K-modes,GMM聚类旨在将n个观察值分为k个集群。 K-means定义硬分配:样本将是且仅与一个集群相关联。 然而,GMM为每个样本定义一个软分配。 每个样本具有与每个集群相关联的概率。 当给定集群k的数量时,两种算法都是简单且足够快的聚类。
DBSCAN
PCA, SVD
- 定义问题。你想解决什么问题?
SAS视觉数据挖掘和机器学习为初学者学习机器学习和应用机器学习方法提供了一个良好的平台。
以上为译文
Which machine learning algorithm should I use?,作者:Hui Li,译者:tiamo_zn,审校:。
文章为简译,更为详细的内容,请查看原文
最后更新:2017-05-21 23:01:29