我有一个包含10个不同输入和1个输出的庞大数据集。所有的输出和输入都是离散的(低、中、高)。我原本考虑为这个问题创建一个神经网络,然而,当我设计网络时,设定了3个不同的输出(低、中、高)并使用softmax神经元时,我得到的基本是一个“概率”。我的理解正确吗?
这让我考虑是否应该尝试使用朴素贝叶斯分类器,从而忽略输入变量之间的可能相关性,但在大量数据集上,朴素贝叶斯显示出了 promising的结果。
在这种情况下,有没有理由选择神经网络而不是贝叶斯?当你希望输出概率(在神经网络中使用softmax函数)时,选择神经网络的理由是什么?
回答:
是的,使用输出层的softmax激活函数,你可以将输出解释为概率。
选择人工神经网络(ANN)而不是朴素贝叶斯的潜在原因是你提到的可能性:输入变量之间的相关性。朴素贝叶斯假设所有输入变量都是独立的。如果这个假设不正确,那么它可能会影响朴素贝叶斯分类器的准确性。具有适当网络结构的ANN可以处理输入变量之间的相关性/依赖性。