我的数据集中包含多个数值属性和一个二元类。在Weka中,有没有办法使用聚类器并将结果传递给分类器(比如SMO)来提高分类的效果?
回答:
你可以通过以下方法在Weka Explorer中将聚类信息添加到你的数据中:
- 加载你喜欢的数据集
- 选择你的聚类模型(我使用了SimpleKMeans)
- 根据需要修改聚类器的参数
- 使用训练集进行聚类模式
- 开始聚类过程
- 一旦聚类生成后,右键点击结果列表并选择“可视化聚类分配”
- 选择Y为聚类,然后点击保存按钮,如下所示:
- 将数据保存到指定位置。
然后你应该能够加载这个文件,并像使用其他属性一样在分类器中使用聚类信息。只要确保类别设置为正确的属性,你就可以开始了。
注意:当我进行这些测试时,我使用J48来评估类别,似乎J48仅使用聚类的值来估计类别。模型的准确性也出奇的高,所以要么数据集太简单,要么我在聚类过程中可能遗漏了某个步骤。
希望这对你有帮助!