通常,我们通过以下方式将cross_val_score
应用于Sklearn
模型。
scores = cross_val_score(clf, X, y, cv=5, scoring='f1_macro')
现在我有自己的模型,希望对其进行交叉验证。我应该如何操作?
tf.keras.backend.clear_session()model = tf.keras.models.Sequential()model.add(Masking(mask_value=0.0, input_shape=(X_train.shape[1], X_train.shape[2])))model.add(Bidirectional(LSTM(128, dropout=dropout, recurrent_dropout=Rdropout, return_sequences=True)))# model.add(Bidirectional(LSTM(64, dropout=dropout, recurrent_dropout=Rdropout, return_sequences=True)))# model.add(Bidirectional(LSTM(128, dropout=dropout, recurrent_dropout=Rdropout, return_sequences=True)))model.add(Bidirectional(LSTM(32, dropout=dropout, recurrent_dropout=Rdropout)))# model.add(Dense(6, activation='relu'))# model.add(Dense(4, activation='relu'))model.add(Dense(num_classes, activation='softmax'))adamopt = tf.keras.optimizers.Adam(lr=0.003, beta_1=0.9, beta_2=0.999, epsilon=1e-8)RMSopt = tf.keras.optimizers.RMSprop(lr=0.0007,rho=0.9, epsilon=1e-6)model.compile(loss='binary_crossentropy', optimizer=RMSopt, metrics=['accuracy'])
print(cross_val_score(model, X_train, y_train, cv=2,scoring='accuracy'))TypeError: Cannot clone object '<tensorflow.python.keras.engine.sequential.Sequential object at 0x7f86481170f0>' (type <class 'tensorflow.python.keras.engine.sequential.Sequential'>): it does not seem to be a scikit-learn estimator as it does not implement a 'get_params' methods.
我认为cross_val_score
仅适用于Sklearn
模型?
回答:
cross_val_score
确实仅适用于Sklearn模型,或者是实现了相同所需功能的模型,而Keras模型则不符合这一要求。
Keras没有预构建的函数允许您对模型进行交叉验证,您需要自己编写交叉验证算法。
首先,您需要决定想要多少个折叠,然后可以使用sklearn中的KFold类将数据集分成相应的折叠。(请注意,KFold.split返回的是数据点的索引,而不是实际的数据点)
然后,您应该为每个分割训练一个新模型,并计算您想要的指标。您可以参考这个教程获取更多信息。