在进行多类分类时,使用单一多输出神经网络与使用多个一对多神经网络之间是否有理论上的支持或反对的论据?
在两种情况下,一旦获得所有输出值,就会使用相同的决策规则:激活度最高的输出“获胜”,并决定预测返回的类别。
但我想知道——以及为什么——在同一个神经网络上计算所有输出比分别计算更好或更差。
回答:
我大多反对使用相同的 neural network 结构进行多重分类。这在其他 AI 结构中非常罕见。你不会在支持向量机或决策树中这样做。我认为这在某种程度上混淆了问题。
支持这种做法的论点是,你的隐藏层只是低级特征检测器。你的多个分类(或回归也一样)输出神经元现在独立地使用输入层和隐藏层传递上来的低级特征。
我没有尝试将这些结合到同一个 ANN 中与分别处理。我猜测成功的程度将取决于多个分类试图实现的目标之间的相似性。