在Andres NG的Coursera课程中,一个输出4个不同分类的神经网络被表示为:
这个网络有4层。为了实现多类分类,是否需要4层,还是3层就足够了?
回答:
多类设置与隐藏层的数量无关。你甚至可以删除所有隐藏层,得到一个简单的多项式逻辑回归(线性模型),它也能很好地处理多类问题。网络的深度通常被用作一种架构启发式方法,目前已知在广泛的任务(包括图像处理)上表现良好,因此对于更难的问题(多类设置肯定比二元分类更复杂),增加更多的层可能会有益。但是,正如@jorgenkg在评论中已经建议的,这并不是必须的,因为理论上甚至单一隐藏层就足以模拟任何连续函数达到任何所需的精度。唯一的“问题”是,你是否真的能够学会一个表现良好的浅层模型,但这完全是另一个问题了。