我正在学习人工智能入门课程,老师提到一个观点,即ZeroR分类器的准确率是解释其他分类器的有用基线。我在网上搜索了一下,但还是不太明白,谁能解释一下这是什么意思呢?提前感谢。
回答:
我认为推理过程如下:ZeroR分类器只是将每个值分配给最常见的类(通过检查训练数据发现)。这意味着如果您的数据中55%是A类,10%是B类,5%是C类等等,那么ZeroR将正确分类55%。如果您的数据中33%是A类,31%是B类,28%是C类等等,那么ZeroR将正确分类33%。
除了随机选择类别之外,这几乎是你所能得到的最愚蠢的分类器,因此你可以通过与其他分类器相比,它们的表现好多少来衡量其他分类器。给定某个数据集,您可以使用ZeroR来找出您可能期望的最低性能。