使用naiveBayes (e1071)进行分类时不起作用($levels返回NULL)

我使用naiveBayes (e1071 http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Classification/Na%C3%AFve_Bayes)来对我的数据集进行分类(分类类别:”class” 0/1)。以下是我所做的操作:

library(e1071)arrhythmia <- read.csv(file="/home/.../arrhythmia.csv", head=TRUE, sep=",")#将数据分为训练集和测试集,比例为70:30trainingIndex <- createDataPartition(arrhythmia$class, p=.7, list=F)arrhythmia.training <- arrhythmia[trainingIndex,]arrhythmia.testing <- arrhythmia[-trainingIndex,]nb.classifier <- naiveBayes(class ~ ., data = arrhythmia.training)predict(nb.classifier,arrhythmia.testing[,-260])

分类器不起作用,以下是我得到的结果:

> predict(nb.classifier,arrhythmia.testing[,-260])factor(0)Levels: > str(arrhythmia.training)'data.frame':   293 obs. of  260 variables: $ age                         : int  75 55 13 40 44 50 62 54 30 46 ... $ sex                         : int  0 0 0 1 0 1 0 1 0 1 ... $ height                      : int  190 175 169 160 168 167 170 172 170 158 ... $ weight                      : int  80 94 51 52 56 67 72 58 73 58 ... $ QRSduration                 : int  91 100 100 77 84 89 102 78 91 70 ... $ PRinterval                  : int  193 202 167 129 118 130 135 155 180 120 ... # 以及其他260个属性> str(arrhythmia.training[260])'data.frame':   293 obs. of  1 variable: $ class: int  1 0 1 0 0 1 1 1 1 0 ...> nb.classifier$levelsNULL

我尝试使用内置的数据集(iris),一切正常。我的方法哪里出了问题?


回答:

请确保将类别变量视为因子;即

nb.classifier <- naiveBayes(as.factor(class) ~ ., data = arrhythmia.training)

顺便说一下,你不需要在predict调用中排除类别变量。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注