基本上,我有一个给定的训练集和测试集,我将在训练集上测试各种模型和特征选择,我知道训练集的输出标签属于10个不同的类别,但据告知其中一个特定类别在训练集中没有给出任何样本/出现。
我该如何处理这种情况?
我知道可以对不平衡数据集使用过采样/欠采样方法,但如果其中一个类别没有出现,这种方法会有帮助吗?
回答:
你的用例属于零样本学习领域,最初被称为零数据学习。它依赖于构建可在给定样本之外进行泛化的底层类别的可分离表示。这不是一个容易解决的问题,但根据你的数据和问题空间,可能是可行的。以下是一些入门资源: