我正在处理一个我认为是二元分类的问题。
假设我有3个示例句子。对于每个句子,我将其分成任意块。现在,句子S可能有X(n)个块,其中n从1到4。为了在我的问题上使用监督学习,我将其中一个块标记为正确的块,比如X(2) = 1,而其余的标记为零,X(1,3,4) = 0。
现在我想训练一个分类器,其特性是,如果它对句子S中的一个块标记为正,那么它就不能对句子S中的任何其他块标记为正。也就是说,S中剩余的所有块自动变为零。
我明白这在某种程度上构成了我的数据中的依赖关系,但我不知道如何正确地建模/使用哪种类型的建模。
提前感谢!
回答:
实际上这看起来像是一个简单的分类问题,你的输入形式是
chunk 1, chunk 2, chunk 3, chunk 4
输出是一个表示哪个块是正的一热编码,仅此而已。所以你有一个普通的“多类别”分类,仅此而已。
没有必要使用任何复杂的结构化预测器。