为什么我会得到这样的输出?
我使用的数据集如下。http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data
回答:
颜色代表直方图各列中carname
的分布情况。
显然,由于该属性的值数量过多,这个属性是一个名义属性(我在直方图上方看到的),有305个不同的值:会有太多不同的颜色,每种颜色只能代表一个实例。Weka无法表示所有这些颜色(我猜它没有保存那么多颜色)。
顺便说一下,正如Anony-Mousse在他的评论中所说,忽略颜色:carname
应该是一个字符串属性,而不是名义属性,如果你将其转换为字符串属性,颜色就会消失,因为观察其分布是没有意义的。