晚上好,
我正在进行一个监督分类任务。我有一个包含大量数据的大型arff文件,格式为“文本”,类。只有两个类别,E和I。
我可以将这些数据加载到Weka Explorer中,对其应用StringToWordVector并使用TF-IDF,然后使用LibSVM进行分类并获得结果。但我需要使用5×2交叉验证并获取ROC曲线下面积。因此,我保存了处理后的数据,打开Weka Experimenter,加载数据,设置为2折,5次迭代,然后将算法设置为LibSVM。
当我转到RUN标签并按下开始时,我得到了以下错误:
18:31:18: 已开始
18:31:18: 类属性不是标称型!
18:31:18: 已中断
18:31:18: 共有1个错误
我不知道为什么会发生这种情况,具体错误是什么,或者如何修复它。我在谷歌上搜索了这个错误,但没有找到任何解决方案。我不确定接下来该怎么做来解决这个问题。
我可以回到Explorer,重新加载那个处理后的文件,并且可以无问题地进行分类,但我需要在Experimenter中完成这个操作。
回答:
如果你的类属性是数值型(如0,1),将其更改为标称型形式,如true
,false
。