我有一个数据集,其中类别分布不均衡。类别是0
、1
或2
。
我如何计算每个类别的预测错误,然后在scikit-learn中相应地重新平衡weights
?
回答:
如果你想完全平衡(将每个类别视为同样重要),你可以简单地传递class_weight='balanced'
,正如文档中所述:
“balanced”模式使用y的值自动调整权重,使其与输入数据中类别频率成反比,计算公式为
n_samples / (n_classes * np.bincount(y))
我有一个数据集,其中类别分布不均衡。类别是0
、1
或2
。
我如何计算每个类别的预测错误,然后在scikit-learn中相应地重新平衡weights
?
回答:
如果你想完全平衡(将每个类别视为同样重要),你可以简单地传递class_weight='balanced'
,正如文档中所述:
“balanced”模式使用y的值自动调整权重,使其与输入数据中类别频率成反比,计算公式为
n_samples / (n_classes * np.bincount(y))