我想创建一个前馈神经网络,其中训练数据中的输出是布尔值,0 或 1。
但在使用中,我希望输出是该输入产生 0 或 1 的期望概率。
鉴于最常见的反向传播形式采用 sigmoid 激活函数,因此这似乎不太可能产生实际的概率作为输出(sigmoid 曲线看起来并不像是“概率”函数 – 抱歉,我知道这有点牵强)。
或者也许我错了。使用 sigmoid 激活函数并使用反向传播训练的前馈神经网络的输出,是否可以安全地被视为获得 1 而不是 0 的实际概率?
回答:
是的,如果你使用标准的 sigmoid 激活函数,这将以你期望的方式工作。
证明这一点的数学有些复杂,但它实际上归结为你正在训练 sigmoid 函数来生成输出训练集的平均值(这是在普通反向传播中使用平方误差函数的结果)。由于两个可能的值是 0 和 1,因此平均值正好等于获得 1 的概率。