深度学习技术(深度神经网络、深度信念网络、深度堆叠网络等)在某些领域非常高效。它们需要很长时间来训练,但这只是一次性成本。
我阅读了几篇关于不同技术的论文,这些论文只关注准确性和训练时间。训练后,它们在实践中产生答案的速度有多快?
是否有关于基准测试深度网络的数据,这些网络可能有数百万个参数?
我认为它们应该相当快,因为所有权重都是固定的,但由于函数可能非常复杂且参数数量相当高,我不确定它们在实践中的实际表现如何。
回答:
速度在很大程度上取决于网络的大小。假设你的网络是密集的前馈网络,每层网络由一个(通常是非常矩形的)矩阵表示。将输入推过网络需要进行矩阵向量乘法。因此,如果你有一个8层的网络,你将需要进行8次矩阵乘法。每次乘法所需的时间取决于数据集的原始维度和这些层的尺寸。