我尝试将多个样本分类为1或0,但在使用随机梯度下降作为优化算法时,所有样本都被分类为1或0。
当使用默认的L-BFGS算法时,分类结果符合预期,样本被分类为1和0。我尝试调整了动量、学习率、批量大小、衰减和误差系数,但每次的误差都相同。任何帮助都将不胜感激!
num_feats = X_train.get_num_features()layers = DynamicObjectArray()layers.append_element(NeuralInputLayer(num_feats))layers.append_element(NeuralLogisticLayer(16))layers.append_element(NeuralLogisticLayer(8))layers.append_element(NeuralSoftmaxLayer(2))MLP = NeuralNetwork(layers)MLP.set_gd_momentum(0.9)MLP.set_gd_learning_rate(0.001)MLP.set_gd_mini_batch_size(200)MLP.set_optimization_method(0)MLP.set_l2_coefficient(1e-4)MLP.set_epsilon(1e-8)MLP.set_max_num_epochs(200)MLP.quick_connect()MLP.initialize_neural_network()MLP.set_labels(y_train)MLP.trainconf_mat_MLP = acc.get_confusion_matrix(y_pred_MLP, y_test)print(conf_mat_MLP)
输出结果为:
[[2400 0][ 314 0]]
声明使用SGD而不是L-BFGS的代码行:
MLP.set_optimization_method(0)
注意:我在Scikit-learn和Weka中使用了相同的方式和完全相同的训练/测试集进行随机梯度下降,这两种方法都没有产生这种错误,因此我认为这可能与我配置算法的方式有关,但我不知道具体是什么问题!
可能有用的链接 –
文档:http://www.shogun-toolbox.org/api/latest/classshogun_1_1CNeuralNetwork.html
源码:http://www.shogun-toolbox.org/api/latest/NeuralNetwork_8h_source.html
回答:
你应该显著降低你的小批量大小 – 尝试使用20左右的批量大小。