使用不平衡数据构建机器学习分类器

我有一个包含1400个观测值和19列的数据集。目标变量…

学习者基准比较的结果取决于重采样的实例化。我该如何考虑这一点?

我运行了下面的代码。如果我禁用实例化(如图所示),三个…

在训练/测试拆分前后进行欠采样

我有一个信用卡数据集,其中98%的交易是非欺诈,2%是…

在WEKA中监督重采样和非监督重采样的区别是什么?

我想知道weka.filters.supervised…

在基准实验中使用重采样的getResamplingIndices函数 – mlr

我在基准实验中使用了嵌套交叉验证。我希望检索每个外部循…

在Caret包中进行数据分区和过拟合问题

我在阅读Caret包时看到了以下代码; createD…

分类精度优化针对单一类别?

我的数据集有两个类别。其中不感兴趣的类别占90%,感兴…

如何正确地使用Python scikit-learn进行欠采样?

我试图使用Python的scikit-learn对多数…

不进行k折的分层抽样

我可以在Python中使用分层抽样,将数据按80%训练…

如何修正efp()错误“变量’data’的类型无效(列表)”?

我有一个包含超过10万行的单列浮点时间序列数据。我希望…

从高维函数中抽样

我有一个函数 f,它接受 N 个实数输入,并且计算成本…

逻辑回归分类器的自助聚合(bagging)

我正在抽取N个自助样本,并在这些样本上训练N个逻辑回归…