我有一个训练集和一个测试集,我想用Weka对其进行分类。因为我的属性是文本,我明白我必须首先应用字符串到单词的过滤器。正如这里所描述的,我需要执行以下步骤:1- 加载训练集和测试集,并应用过滤器。2- 使用训练集训练分类器并保存模型。3- 加载模型并将其应用于测试集。
在我的实验中,我需要使用训练好的分类器来测试多个测试集……那么,我需要重复步骤1、2和3,还是只需重复第三步?
另外,我是否需要将测试集中的类别替换为问号(?),还是可以保留类别,让分类器尝试预测类别?
回答:
您可以简单地重复第三步,假设所有测试集都已被过滤并保存为过滤后的版本。如果您选择“更多选项…”按钮并勾选输出预测框,那么您就不必用问号替换类别。