我正在学习这些关于自然语言处理和机器学习的幻灯片。在第7张幻灯片上,作者提到“在二元分类中,我们可以只从输入映射到特征空间。”这似乎与之前在幻灯片中介绍的非二元分类不同,后者是从X x Y映射到特征空间。为什么在二元分类中不从所有可能的X x Y组合进行映射呢?看起来每个可能的X都可以被分配到Y中的两个标签之一(即X x Y –>r^n)
回答:
简而言之 – 这些幻灯片具有误导性。你可以将二元分类视为多标签分类,因此没有额外的限制。然而,X x Y -> F的技巧在二元分类中是多余的。因为在这里,任何关于分类到类0
的信息,也会给你关于分类到类1
的信息(因为没有其他选择,只有两种可能性),而在多类别场景中,不属于类0
并不会给你实际的信息(它仍然可能是类2
或k
的一部分),所以为某些类别定义特征是有原因的。总结如下:
- 尽管幻灯片上写的是什么,你可以将二元分类视为多类别分类
- 在二元分类中使用X x Y -> F映射是多余的