我的混淆矩阵实现是否正确?还是其他地方出了问题?

我训练了一个具有5个类别的多类别SVM分类器,即svm(1)...svm(5)。

然后,我使用了在训练这些分类器时未使用的5张图像进行测试。

这5张图像随后用各自的分类器进行测试。即,如果5张图像来自第一类,它们将针对同一类进行测试。

  predict = svmclassify(svm(i_t),test_features);

预测结果生成一个5×1的向量显示结果。

-1 1 1 1-1

我将这些结果相加,然后插入到一个对角矩阵中。

理想情况下,当所有图像都被正确分类时,它应该是一个对角线上写着5的对角矩阵。但结果非常差。我的意思是在某些情况下我得到了负结果。我只是想验证这种糟糕的结果是否是因为我的混淆矩阵不准确,或者我应该使用其他特征提取器。

这是我编写的代码

  svm_table = [];  for i_t = 1:numel(svm)      test_folder = [Path_training folders(i_t).name '\']; %选择作者         feature_count = 1; %初始化特征向量累积计数      for j_t = 6:10 %这5张图像未用于训练          [img,map] = imread([test_folder imlist(j_t).name]);           test_img = imresize(img, [100 100]);          test_img = imcomplement(test_img);          %在此处提取每张图像的特征。          %每张图像的特征向量是一个1x16的向量。          test_features(feature_count,:) = Features_extracted;          %特征向量累积在一个单一矩阵中。每行是一张图像          feature_count = feature_count + 1; %增加计数      end      test_features(isnan(test_features)) = 0; %查找NaN并替换为0      %我在一些图像中得到了NaN,这对SVM造成了问题,所以只是替换为0      predict = svmclassify(svm(i_t),test_features); %生成预测的列向量      svm_table(end+1,end+1) = sum(predict); %将它们相加并对角线上添加到矩阵中  end

这就是我得到的结果。看起来像一个混淆矩阵,但结果非常差。

-1     0     0     0     0 0    -1     0     0     0 0     0     3     0     0 0     0     0     1     0 0     0     0     0     1

所以我只想知道这里出了什么问题。是我的混淆矩阵实现,我的SVM测试方式,还是我的特征选择。


回答:

我想补充一些问题:

  1. 你提到:<< 这5张图像随后用各自的分类器进行测试。即,如果5张图像来自第一类,它们将针对同一类进行测试。 >>

你永远不应该知道测试图像的类别(类别)。当然,你需要知道测试类别的标签来计算各种指标,如准确率、精确度、混淆矩阵等。除此之外,当你使用SVM来确定示例属于哪个类别时,你必须尝试所有SVM。

训练和测试多类别SVM有两种流行的方法,即一对所有和一对一方法。阅读这个答案及其相应的问题以详细了解它们。

我不知道MATLAB SVM是否能够进行多类别分类,但如果你使用LIBSVM,那么它使用一对一方法。它也会为你正确地进行测试。然而,如果你想设计自己的一对一分类器,你应该这样做:

假设你有5个类别,那么训练所有可能的组合对=5c2=10对({1,2}, …, {1,5},{2,1},…,{2,5},…,{5,4})。在测试时,你必须应用所有10个模型并计算所有投票来决定最终结果。例如,我们为4对训练模型(假设),({1 vs 2}, {1 vs 3}, {2 vs 1}, {2 vs 3})和4个模型的输出分别是{1,1,0,1}。这意味着,你的4个预测类别是{1,1,1,2}。因此,最终类别是1。

一旦你得到所有预测标签,你实际上可以使用命令confusionmat来获取混淆矩阵。如果你想自己制作,那么制作一个5x5的零矩阵。在位置(实际标签,预测标签)上加1,即如果实际类别是2而你预测为3,那么在矩阵中的位置(第2行,第3列)上加1。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注