将K折交叉验证应用于人工神经网络

我根据一门机器学习课程开发了一个基于人工神经网络（ANN）的模型，代码如下：

import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport tensorflow as tfdataset = pd.read_excel('CHURN DATA (2).xlsx')dataset.replace([np.inf, -np.inf], np.nan, inplace=True)dataset = dataset.fillna(0)X = dataset.iloc[:, 2:45].valuesy = dataset.iloc[:, 45].valuesfrom sklearn.preprocessing import LabelEncoderle = LabelEncoder()X[:, 1] = le.fit_transform(X[:,1])X[:, 2] = le.fit_transform(X[:,2])X[:, 3] = le.fit_transform(X[:,3])from sklearn.compose import ColumnTransformerfrom sklearn.preprocessing import OneHotEncoderct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(),[0])], remainder = 'passthrough')X = np.array(ct.fit_transform(X))from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)from sklearn.preprocessing import StandardScalersc = StandardScaler()X_train = sc.fit_transform(X_train)X_test = sc.transform(X_test)ann = tf.keras.models.Sequential()ann.add(tf.keras.layers.Dense(units = 43, activation = 'relu'))ann.add(tf.keras.layers.Dense(units = 43, activation = 'relu'))ann.add(tf.keras.layers.Dense(units = 1, activation = 'sigmoid'))ann.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])ann.fit(X_train, y_train, batch_size = 256, epochs = 100)y_pred = ann.predict(X_test)y_pred = (y_pred > 0.5)from sklearn.metrics import confusion_matrix, accuracy_scorecm = confusion_matrix(y_test, y_pred)print(cm)accuracy_score(y_test, y_pred)

然而，当我尝试添加K折交叉验证时，如下所示：

from sklearn.model_selection import cross_val_scoreaccuracies = cross_val_score(ann, X = X_train, y = y_train, cv = 10)mean = accuracies.mean()variance = accuracies.std()

我得到了以下错误：

TypeError: If no scoring is specified, the estimator passed should have a 'score' method. The estimator <tensorflow.python.keras.engine.sequential.Sequential object at 0x000001A52F049F88> does not.

当我尝试使用准确率作为评分标准时，如下所示：

accuracies = cross_val_score(estimator = ann,scoring = "accuracy", X = X_train, y = y_train, cv = 10)

我得到了以下错误：

Cannot clone object '<tensorflow.python.keras.engine.sequential.Sequential object at 0x000001A52F049F88>' (type <class 'tensorflow.python.keras.engine.sequential.Sequential'>): it does not seem to be a scikit-learn estimator as it does not implement a 'get_params' methods.

回答：

错误信息已经说明了一切。你不能直接将Keras模型传递给Sklearn。Keras为Sklearn提供了一个包装器，因此两者确实可以一起使用。它的名称是tensorflow.keras.wrappers.scikit_learn.KerasClassifier。

以下是使用MNIST数据集的可重现示例：


array([0.74008333, 0.65      , 0.71075   , 0.561     , 0.66683333])



相关文章：

ValueError: 分类指标无法处理多标签指示器和二元目标的混合
SciKit Learn、Keras 和 Pytorch 的区别
混淆矩阵错误：“分类指标无法处理多标签指示器和多类目标的混合”
Sklearn指标值与Keras值差异很大
我的GridSearchCV不起作用，我不知道为什么
ValueError: 尝试计算ROC曲线时，输入形状错误（2, 256, 3）
TypeError: ‘Tensor’ 类型对象无法使用 len() 函数，当在 Tensorflow 中使用自定义度量时
在Kfold循环中是否需要重置模型权重？
使用TfidfVectorizer时出现错误，但使用CountVectorizer时正常
使用TensorFlow预处理（tf.feature_column）与scikit-learn模型相结合

学技术

将K折交叉验证应用于人工神经网络

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复