我想让仅包含全连接层的Keras模型收敛

我有一个仅包含全连接层(Dense)的Keras模型。我的训练图像尺寸是227*227,有100个类,每个类有一个训练图像,我希望模型过拟合并达到100%的训练准确率。

问题:我尝试调整模型的超参数,但它无法收敛到100%的训练准确率。尽管这只是一个全连接层模型。

这是我的代码:

X_train, y_train = ...# 创建Keras模型model = Sequential()model.add(Dense(100, input_dim=input_dim, activation='softmax',                kernel_regularizer=regularizers.l2(0.01),                activity_regularizer=regularizers.l1(0.01)))model.compile(optimizer='rmsprop',              loss='categorical_crossentropy',              metrics=['accuracy'])model.summary()# 回调和训练csv_logger = CSVLogger('training_log_v1.csv')model.fit(x_train, y_train, epochs=10000, batch_size=100, callbacks=[csv_logger])

这是上述代码的图表。

enter image description here

我尝试了从10K到20K个epoch的不同超参数实验。在某些epoch之后,损失不再下降,训练准确率也没有改善。

我尝试了不同的优化器(及其超参数)和正则化。除了优化器和正则化器,这里没有太多超参数可以调整,对吗?

如果有人能帮助我使模型收敛,那将非常感谢。谢谢!


回答:

我成功实现了过拟合。这是我用于过拟合实验的超参数。

类别: 100每个类别的样本数: 1kernel_regularizer=regularizers.l2(0.01)activity_regularizer=regularizers.l1(0.01)优化器: Adam学习率: 0.00001设置的Epochs: 50000批量大小: 256

我在大约12K个epoch时达到了99%的训练准确率,并在约25K个epoch之前持续降低损失。

Related Posts

在使用k近邻算法时,有没有办法获取被使用的“邻居”?

我想找到一种方法来确定在我的knn算法中实际使用了哪些…

Theano在Google Colab上无法启用GPU支持

我在尝试使用Theano库训练一个模型。由于我的电脑内…

准确性评分似乎有误

这里是代码: from sklearn.metrics…

Keras Functional API: “错误检查输入时:期望input_1具有4个维度,但得到形状为(X, Y)的数组”

我在尝试使用Keras的fit_generator来训…

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据?

我想为分类问题创建合成数据。我使用了sklearn.d…

如何处理预测时不在训练集中的标签

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注