Home IT技术在WEKA中，省略值与未知值的区别是什么

在WEKA中，省略值与未知值的区别是什么

IT技术 xiaolong · 2025年4月7日 · 0 Comment

在WEKA中，属性值的未知值与省略值有什么区别？我了解到，对于缺失值，我们会在相应属性上标记问号?，而对于省略值，则使用0。它们之间有什么不同？

假设我们要在n维空间中绘制数据，那么未知值将如何沿其轴表示，因为它们并不是零值。

谢谢@隐藏人名

回答：

不同的分类器对未知值的处理方式各不相同。例如，有些分类器会将该特征的平均值分配给每个未知值。这样，未知值就可以被绘制出来。

省略值仅在稀疏的ARFF文件中使用。这些文件在数据集稀疏时（即大多数值为0）非常有用。你不需要在文件中写出所有的0，只需写出非零值及其相应的位置。在这种情况下，所有未表示的值都被假定为0。

基本上，如果你不知道某个值，你就应该为其赋予未知值?。

data-mining machine-learning weka

发表回复取消回复