在R中使用SVM,训练数据集

这是一个更普遍的问题,但由于我使用的是R语言,因此使用相应的标签

我的训练数据集有15,000个条目,其中大约20个我想用作正样本数据集来构建SVM。我原本打算使用剩余的重采样数据集作为负样本数据集,但我在想,是否应该使用相同数量(约20个)作为负样本数据集,否则会非常不平衡?在R中,有没有一种简单的方法可以在1000轮重采样后将分类器汇总(基于集成的方法)?(甚至可以使用e1071包)

后续问题:我想在之后为每个预测计算一个分数,直接将概率乘以100可以吗?

谢谢


回答:

你可以尝试使用“类别权重”方法,其中较小的类别会获得更高的权重,从而在误分类正标记类别时付出更高的代价。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注