在WEKA中监督重采样和非监督重采样的区别是什么?

我想知道weka.filters.supervised.instance.Resampleweka.filters.unsupervised.instance.Resample之间的区别是什么?在哪些情况下我们应该使用每一种方法?


回答:

监督和非监督重采样的文档是相同的,除了监督重采样的文档中有一句额外的说明:

该过滤器可以保持子样本中的类别分布,或者偏向于均匀分布的类别分布。

监督重采样还有一个额外的参数:

-B <num>偏向均匀类别分布的偏置因子。0 = 输入数据中的分布  1 = 均匀分布。(默认值0)

因此,监督重采样仅在存在类别变量时适用。当完全偏向输入分布(B=0)时,每个子样本都会复制完整数据集的类别分布。B=1相当于非监督重采样,其中点是从整个群体中均匀抽取的,不考虑类别。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注