我想在我的SVM分类中加入一个无效类别。例如,在水果分类中,我希望有苹果、橙子、香蕉和“不是水果”(无效类别)。我想知道是为每个类别创建一个二元SVM分类器(一个用于苹果,一个用于橙子,等等)更好,还是创建一个包含无效类别作为其中一个类的SVM分类器,并向其提供无效的训练数据更好。
更具体地说,我有一个分类器用于对时间序列数据进行分类。我需要将一些输入的时间序列分类为无效类别(或者基本上是不属于任何所需类别)。
回答:
“不是水果”只是另一个类。你需要的是多类分类。SVM通过超平面来分离类别,所以你需要在上面再加一个算法。现在大多数软件包都提供了这种多类分类,但在性能上有所不同。
- 它们将每个类与其他类的集合进行对比
- 它们将每个类与每个其他类进行对比
无论你先做什么,你都会得到多个结果(类似于石头剪刀布游戏)
- 在这种情况下,你可能有0到n个正面结果
- 在这种情况下,你可能有1到n个类,每个类有1到n-1票
我建议使用一个能够进行投票的库。
虽然你提到了“时间序列数据”,这听起来不像是水果,可能会有其他要求