我的混淆矩阵实现是否正确?还是其他地方出了问题?

我训练了一个具有5个类别的多类别SVM分类器,即svm(1)...svm(5)。

然后,我使用了在训练这些分类器时未使用的5张图像进行测试。

这5张图像随后用各自的分类器进行测试。即,如果5张图像来自第一类,它们将针对同一类进行测试。

  predict = svmclassify(svm(i_t),test_features);

预测结果生成一个5×1的向量显示结果。

-1 1 1 1-1

我将这些结果相加,然后插入到一个对角矩阵中。

理想情况下,当所有图像都被正确分类时,它应该是一个对角线上写着5的对角矩阵。但结果非常差。我的意思是在某些情况下我得到了负结果。我只是想验证这种糟糕的结果是否是因为我的混淆矩阵不准确,或者我应该使用其他特征提取器。

这是我编写的代码

  svm_table = [];  for i_t = 1:numel(svm)      test_folder = [Path_training folders(i_t).name '\']; %选择作者         feature_count = 1; %初始化特征向量累积计数      for j_t = 6:10 %这5张图像未用于训练          [img,map] = imread([test_folder imlist(j_t).name]);           test_img = imresize(img, [100 100]);          test_img = imcomplement(test_img);          %在此处提取每张图像的特征。          %每张图像的特征向量是一个1x16的向量。          test_features(feature_count,:) = Features_extracted;          %特征向量累积在一个单一矩阵中。每行是一张图像          feature_count = feature_count + 1; %增加计数      end      test_features(isnan(test_features)) = 0; %查找NaN并替换为0      %我在一些图像中得到了NaN,这对SVM造成了问题,所以只是替换为0      predict = svmclassify(svm(i_t),test_features); %生成预测的列向量      svm_table(end+1,end+1) = sum(predict); %将它们相加并对角线上添加到矩阵中  end

这就是我得到的结果。看起来像一个混淆矩阵,但结果非常差。

-1     0     0     0     0 0    -1     0     0     0 0     0     3     0     0 0     0     0     1     0 0     0     0     0     1

所以我只想知道这里出了什么问题。是我的混淆矩阵实现,我的SVM测试方式,还是我的特征选择。


回答:

我想补充一些问题:

  1. 你提到:<< 这5张图像随后用各自的分类器进行测试。即,如果5张图像来自第一类,它们将针对同一类进行测试。 >>

你永远不应该知道测试图像的类别(类别)。当然,你需要知道测试类别的标签来计算各种指标,如准确率、精确度、混淆矩阵等。除此之外,当你使用SVM来确定示例属于哪个类别时,你必须尝试所有SVM。

训练和测试多类别SVM有两种流行的方法,即一对所有和一对一方法。阅读这个答案及其相应的问题以详细了解它们。

我不知道MATLAB SVM是否能够进行多类别分类,但如果你使用LIBSVM,那么它使用一对一方法。它也会为你正确地进行测试。然而,如果你想设计自己的一对一分类器,你应该这样做:

假设你有5个类别,那么训练所有可能的组合对=5c2=10对({1,2}, …, {1,5},{2,1},…,{2,5},…,{5,4})。在测试时,你必须应用所有10个模型并计算所有投票来决定最终结果。例如,我们为4对训练模型(假设),({1 vs 2}, {1 vs 3}, {2 vs 1}, {2 vs 3})和4个模型的输出分别是{1,1,0,1}。这意味着,你的4个预测类别是{1,1,1,2}。因此,最终类别是1。

一旦你得到所有预测标签,你实际上可以使用命令confusionmat来获取混淆矩阵。如果你想自己制作,那么制作一个5x5的零矩阵。在位置(实际标签,预测标签)上加1,即如果实际类别是2而你预测为3,那么在矩阵中的位置(第2行,第3列)上加1。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注