我正在使用TFRecordDataset迭代器作为输入来训练一个Keras模型。训练阶段运行良好,但是当我调用model.predict
时,模型仍然使用训练数据作为输入,而不是新数据。
# 加载数据为tensorflow迭代器在TFRecordDataset上
X, y = loader.load_training_tensor_iterator()
X_test, y_test = loader.load_test_tensor_iterator()
# 构建模型
input_layer = Input(tensor=X)
reshape = Flatten(input_shape=(-1, 10, 128))(input_layer)
a1 = Dense((200))(reshape)
a1 = BatchNormalization()(a1)
a1 = Activation('relu')(a1)
a1 = Dropout(drop_rate)(a1)
output_layer = Dense(classes_num, activation='sigmoid')(a1)
model = keras.models.Model(inputs=input_layer, outputs=output_layer)
model.compile(optimizer=keras.optimizers.Adam(lr=1e-3),
loss='binary_crossentropy',
target_tensors=[y])
model.fit(
epochs=EPOCHS,
steps_per_epoch=math.ceil(TRAINING_SET_SIZE/BATCH_SIZE))
现在,当我尝试使用模型并获取测试数据的预测时:
# 运行预测
y_pred = model.predict(X_test, steps=3)
我在y_pred
中得到的是训练集X
的预测,而不是X_test
的预测。
如何指定在预测时,输入张量应该是传递给predict
的数据,而不是在Input(tensor=X)
中传递的张量X
?
回答:
请参考Keras文档中关于输入层的部分和compile方法。当您设置tensor参数时,Keras不会为输入创建占位符,这就是您无法在X_test上运行predict的原因。您可以在输入层或compile方法中不设置tensors选项来向模型 feeding 数据,并训练您的模型,这将使您能够通过feeding到占位符来运行predict或使用其他变量进行评估。这里是一个通过Keras数据集API定义的方式进行测试的例子。