在sklearn.model_selection.StratifiedShuffleSplit中,n_splits的作用是什么?

我最近开始使用sklearn,并遇到了StratifiedShuffleSplit函数。虽然我理解它的概念和用途,但我并不完全明白它需要哪些参数才能正常工作,例如n_split。根据sklearn的文档,关于n_splits的描述如下:

n_splits : int, 默认值为10 重新洗牌和分割的迭代次数。

我的最佳猜测是,它告诉StratifiedShuffleSplit函数数据中有多少个层(strata)。


回答:

n_splits是几乎所有交叉验证器的一个参数。一般来说,它决定了你将创建多少个不同的验证(和训练)集。如果你使用StratifiedShuffleSplit,它并不表示层(strata)的数量——这些是从数据集中分类目标的相对频率中隐含得出的。

请看下面的官方文档引用(完整链接在这里

StratifiedShuffleSplit

StratifiedShuffleSplit是ShuffleSplit的一个变体,它返回分层分割,即通过保持每个目标类在完整集合中的相同百分比来创建分割。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注