Keras 二元分类器教程示例仅获得50%的验证准确率。对于二元分类,未经训练的分类器本身就能获得接近50%的准确率。
这个示例直接来自 https://keras.io/getting-started/sequential-model-guide/
import numpy as npimport tensorflow as tffrom tensorflow_core.python.keras.models import Sequentialfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense, Dropoutnp.random.seed(10)# Generate dummy datax_train = np.random.random((1000, 20))y_train = np.random.randint(2, size=(1000, 1))x_test = np.random.random((800, 20))y_test = np.random.randint(2, size=(800, 1))model = Sequential()model.add(Dense(64, input_dim=20, activation='relu'))model.add(Dropout(0.5))model.add(Dense(64, activation='relu'))model.add(Dropout(0.5))model.add(Dense(1, activation='sigmoid'))model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['accuracy'])model.fit(x_train, y_train, epochs=50, batch_size=128, validation_data=(x_test, y_test))score = model.evaluate(x_test, y_test, batch_size=128)
准确率输出。
- 我尝试了多次实验。
- 增加了隐藏层的数量
Epoch 50/50 1000/1000 [==============================] – 0s 211us/sample – loss: 0.6905 – accuracy: 0.5410 – val_loss: 0.6959 – val_accuracy: 0.4812
有人能帮助我理解这里是否有什么问题吗?
- 如何提高这个教程中呈现的“示例”问题的准确率?
回答:
如果你用随机
示例训练分类器,你在x_test
表示的验证数据上总是会得到大约50%的准确率。这是因为你的训练样本被训练为随机类别。同样,验证或测试集也被分配为随机类别。这就是为什么会出现随机的50-50%准确率。你测试训练集的epoch越多,你在训练集上的准确率就会因为过拟合而提高。