当我们提到“深度神经网络的非线性”时,在这个语境下“非线性”一词具体指的是什么?
此外,激活函数的目的是引入网络中的非线性。这个非线性的含义是什么?(我是深度学习的新手。)
回答:
非线性意味着输出不能通过输入的线性组合来重现(这与输出呈现为直线的情况不同——后者的术语是仿射)。
另一种思考方式是:如果网络中没有非线性激活函数,无论神经网络有多少层,它的行为都会像单层感知器一样,因为这些层的总和只会得到另一个线性函数(参见上面的定义)。
当我们提到“深度神经网络的非线性”时,在这个语境下“非线性”一词具体指的是什么?
此外,激活函数的目的是引入网络中的非线性。这个非线性的含义是什么?(我是深度学习的新手。)
回答:
非线性意味着输出不能通过输入的线性组合来重现(这与输出呈现为直线的情况不同——后者的术语是仿射)。
另一种思考方式是:如果网络中没有非线性激活函数,无论神经网络有多少层,它的行为都会像单层感知器一样,因为这些层的总和只会得到另一个线性函数(参见上面的定义)。