最近邻、朴素贝叶斯和决策树分类器能多好地解决给定的分类问题?

3个图表(i)、(ii)、(iii)here展示了具有2个数值属性(x轴和y轴)和一个具有两个类别(圆形和方形)的目标属性的训练集。

我现在想知道数据挖掘算法(最近邻、朴素贝叶斯和决策树)能多好地解决每个分类问题。

我认为朴素贝叶斯(基于属性不相关的朴素假设)在解决第二个问题上比(i)和(iii)更好,因为在这里数值属性之间倾向于更加独立。


回答:

如果你想在这些场景中使用每种给定的方法:

第一个问题可以用决策树方法解决得最好,因为类别可以沿轴线分开。我的意思是在x轴上画一条垂直线,将值分成左右两侧,再在y轴上画一条垂直线,这样你会看到类别会被很好地分开。

第二个问题可以被视为朴素贝叶斯问题,正如你所提到的。

第三个问题可以用k最近邻方法解决。方形类别在坐标系中位置接近,圆形类别也可以带有一些误差被分类。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注