神经网络的学习曲线

我正在尝试优化在Octave上实现的神经网络模型的参数，该模型用于二元分类，具有122个特征（输入）和25个隐藏单元（1个隐藏层）。为此，我有4个矩阵/向量：

size(X_Train): 125973 x 122size(Y_Train): 125973 x 1size(X_Test): 22543 x 122size(Y_test): 22543 x 1

我使用了训练集的20%来生成验证集（XVal和YVal）

size(X): 100778 x 122size(Y): 100778 x 1size(XVal): 25195 x 122size(YVal): 25195 x 1size(X_Test): 22543 x 122size(Y_test): 22543 x 1

目标是生成神经网络的学习曲线。我已经（通过艰难的方式xD）了解到，这需要非常多的时间，因为我使用了Xval和X的完整大小来进行这个操作。

我不知道是否有替代方案。我在考虑减少训练向量X的大小（比如说5000个样本），但我不知道这样做是否可行，或者仅使用训练集的一部分是否会导致结果有偏差？

祝好，

回答：

上述参数总数约为3k（122*25 + 25*1），对于一个示例来说并不大。由于示例数量很大，你可能想要使用随机梯度下降或小批量梯度下降，而不是普通的梯度下降。

请注意，Matlab和Octave通常运行速度较慢，特别是在使用循环时。为了在Matlab/Octave中获得可管理的速度，你需要编写使用矩阵运算而不是循环的代码。

学技术