分组中的二元分类

我正在处理一个我认为是二元分类的问题。

假设我有3个示例句子。对于每个句子，我将其分成任意块。现在，句子S可能有X(n)个块，其中n从1到4。为了在我的问题上使用监督学习，我将其中一个块标记为正确的块，比如X(2) = 1，而其余的标记为零，X(1,3,4) = 0。

现在我想训练一个分类器，其特性是，如果它对句子S中的一个块标记为正，那么它就不能对句子S中的任何其他块标记为正。也就是说，S中剩余的所有块自动变为零。

我明白这在某种程度上构成了我的数据中的依赖关系，但我不知道如何正确地建模/使用哪种类型的建模。

提前感谢！

回答：

实际上这看起来像是一个简单的分类问题，你的输入形式是

chunk 1, chunk 2, chunk 3, chunk 4

输出是一个表示哪个块是正的一热编码，仅此而已。所以你有一个普通的“多类别”分类，仅此而已。

没有必要使用任何复杂的结构化预测器。

学技术