Home IT技术无论输入如何，Keras 上的 CNNs 都收敛到相同的值

无论输入如何，Keras 上的 CNNs 都收敛到相同的值

IT技术 xiaolong · 2025年5月1日 · 0 Comment

我最近在学习 Keras，并尝试使用 CNNs 处理 CIFAR10 数据集。然而，我训练的模型（您可以在此处运行代码）对于每个输入都返回相同的结果，无论输入是什么。我在模型定义中遗漏了什么吗？

回答：

您忘记了对图像进行归一化处理。目前，x_train中的值范围是[0,255]。这会导致梯度更新过大，并使训练过程停滞。一种简单的归一化方案可以是：

x_train = x_train.astype('float32') / 255x_test = x_test.astype('float32') / 255

这样可以使值落在[0,1]的范围内。然后，您肯定会看到训练进展顺利。

更复杂的归一化方案涉及按特征（即按像素）进行归一化或居中。在这种方法中，我们对所有图像进行归一化处理，使得所有图像中的每个像素的平均值为零，标准差为一（即它们大多落在[-1,1]的范围内）：

# 确保值为浮点数x_train = x_train.astype('float32')x_test = x_test.astype('float32')x_mean = x_train.mean(axis=0)x_train -= x_meanx_std = x_train.std(axis=0)x_train /= x_std + 1e-8  # 增加一个小的常数以防止除以零# 使用训练数据的均值和标准差对测试数据进行归一化x_test -= x_meanx_test /= x_std + 1e-8

请注意最后一点：绝对不要用测试数据自己的均值和标准差来归一化测试数据。应使用训练数据的均值和标准差。

conv-neural-network keras machine-learning python

发表回复取消回复