您能简要解释一下深度学习与使用神经网络的传统机器学习之间的区别吗?需要多少层才能使神经网络成为“深度”的?这是否只是营销炒作?
回答:
我不同意@【隐藏人名】的回答。我不明白他所说的对隐藏层进行无监督学习程序是什么意思。
深度学习指的是通常具有超过2到3个隐藏层的神经网络模型。大多数深度学习模型拥有10到100个或更多的层。
深度学习模型最近的革命依赖于两件事:
1. 大量数据的可用性——这是互联网时代的产物
2. GPU的可用性
用于优化深度学习模型的算法称为反向传播算法(在数学上等同于梯度下降)。反向传播实际上至少从80年代就已经存在——它并不是深度学习特有的东西。
由于模型的复杂性和规模,深度学习模型通常需要大量的数据。它们通常拥有数百万可调节的权重参数。优化需要高计算能力,因为训练数据的规模和每次迭代需要计算的数百万个偏导数(相对于权重)。
本质上,深度学习并不是营销炒作。它是一个大型多层神经网络模型,需要大量数据和强大的GPU来训练。一旦训练完成,它们在某些任务上能达到超人的准确度。