Home IT技术如何在特定类别样本为0的情况下对不平衡数据集进行分类？

如何在特定类别样本为0的情况下对不平衡数据集进行分类？

IT技术 xiaolong · 2025年4月15日 · 0 Comment

基本上，我有一个给定的训练集和测试集，我将在训练集上测试各种模型和特征选择，我知道训练集的输出标签属于10个不同的类别，但据告知其中一个特定类别在训练集中没有给出任何样本/出现。

我该如何处理这种情况？

我知道可以对不平衡数据集使用过采样/欠采样方法，但如果其中一个类别没有出现，这种方法会有帮助吗？

回答：

你的用例属于零样本学习领域，最初被称为零数据学习。它依赖于构建可在给定样本之外进行泛化的底层类别的可分离表示。这不是一个容易解决的问题，但根据你的数据和问题空间，可能是可行的。以下是一些入门资源：

classification data-science machine-learning multiclass-classification self-supervised-learning

发表回复取消回复