在Weka中使用属性评估器处理不平衡数据集

我有一个不平衡的数据集。因此，在使用分类器时表现非常差。这是一个二元分类问题，我使用了随机森林作为分类器。真负例与真正例的比例为7:1。所以我尝试解决这个问题，使用了子集评估器和随机森林，并使用最佳优先搜索来找出重要的属性。然后，我只使用数据集中重要的属性和类属性，丢弃了所有其他属性。接着，我再次在数据集上执行随机森林。现在表现变得更加差了。真负例和真正例的比例变成了12:1。我在整个过程中使用了Weka。

我想知道属性评估器是否适用于不平衡数据集？

谢谢你。

回答：

如果一组属性与多数类标签高度相关，那么这会加剧不平衡现象也就不足为奇了。毕竟，你是在移除与少数类标签相关的属性。

学技术

在Weka中使用属性评估器处理不平衡数据集

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复