我想知道我的代码是否达到了我的预期目标;为了给你一些背景信息,我正在实现CNN用于图像分类。我试图使用交叉验证来比较我的不同神经网络架构
这是代码:
def create_model(): model = Sequential() model.add(Conv2D(24,kernel_size=3,padding='same',activation='relu', input_shape=(96,96,1))) model.add(MaxPool2D()) model.add(Conv2D(48,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Conv2D(64,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dense(256, activation='relu')) model.add(Dense(12, activation='softmax')) model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"]) return modelmodel = KerasClassifier(build_fn=create_model, epochs=5, batch_size=20, verbose=1) # 3-Fold Crossvalidationkfold = KFold(n_splits=3, shuffle=True, random_state=2019) results = cross_val_score(model, train_X, train_Y_one_hot, cv=kfold)model.fit(train_X, train_Y_one_hot,validation_data=(valid_X, valid_label),class_weight=class_weights)y_pred = model.predict(test_X)test_eval = model.evaluate(test_X, y_pred, verbose=0)
我在网上找到了关于交叉验证的部分。但是我有些问题理解它。
我的问题:1=> 我可以使用交叉验证来提高我的准确率吗?例如,我运行我的神经网络10次,我的模型获取了最佳准确率发生时的权重
2 => 如果我理解正确,在上面的代码中,results运行我的CNN 3次并显示给我准确率。但是当我使用model.fit时,模型只运行一次;我对吗?
谢谢你的帮助
回答:
-
并不是这样,交叉验证更多的是一种防止过拟合的方法/不要被来自错误分割的数据集的异常结果所迷惑 -> 获得你模型性能的相关估计。如果你想调整模型的超参数,你最好使用
sklearn.model_selection.GridSearchCV
/sklearn.model_selection.RandomSearchCV
-
在执行
cross_val_score
时,对于每个训练/测试集,sklearn 会执行一次fit
然后predict
/evaluate
,所以对于模型的每个新实例,你有一次fit
然后一次predict
/evaluate
;否则你的交叉验证将无效,因为它依赖于对之前数据集的拟合(甚至可能是测试数据!)