我刚刚开始进入机器学习领域。到目前为止,我知道贝叶斯方法是这一领域的主要方法之一。那么还有哪些其他选择呢?以及它们之间的比较,比如在什么情况下应该使用哪种方法。
回答:
-
决策树是一种用于构建用于分类的树的一般机器学习方法。树的每个中间节点都与一个条件相关联,该条件用于选择右子树或左子树以进行未来的分类。树的叶子节点代表问题的类别。请查看如ID3或C4.5(ID3的改进版)这样的算法。决策树速度快,可用于创建非线性决策边界。
-
人工神经网络是一种包含多个神经元层的分类器。每个神经元都是一个具有多个输入和单一输出的函数。神经元的输入是其他神经元的输出或分类器的输入(特征)。神经网络中的信号通常从输入到输出单向流动,但递归神经网络也已被研究。神经网络训练中最重要的算法是反向传播算法 – 一种用于训练多层神经网络的著名算法。
-
元分类器或集成分类器是一种将不同分类器结合起来执行单一分类的方法。最简单的方法是投票,但还有更高级的方法,如:堆叠、分级、提升、AdaBoost、随机森林、旋转森林等。
-
逻辑回归是另一种流行的机器学习算法。它只能创建线性决策边界,但应该比其他更复杂的算法运行得更快,并且在面对新问题时可以作为尝试的第一个算法的良好选择。
-
支持向量机(SVM)是机器学习领域中最常用的算法之一。似乎它被用于大多数分类问题,从文本分类到图像分类。该算法基于对数据集的非线性变换,以便为分类创建线性决策边界。
-
与监督学习不同,在监督学习中每个示例都有一个目标值,无监督学习方法用于分析未标记的数据,如一组文章。无监督学习不用于预测或分类,而是用于检测相关项目的组。你如果要学习这个话题,可能应该从k-means聚类开始。
-
强化学习是一种当学习代理达到某种结果时向其呈现数据的方法。例如,一个学习下棋的代理在赢得比赛时会得到“奖励”,在输掉比赛时会受到“惩罚”,但不会获得关于其中间步骤结果的有用信息。强化学习的算法用于在没有关于每种特定情况下的最佳行动的信息时推导出最佳行动策略。