我在Python中进行一个机器学习项目。在基本的神经网络运行良好之后,我尝试使用sklearn
中的GridSearchCV
函数设置网格搜索来优化参数。grid.fit(X,Y)
函数抛出了这个错误:TypeError: only size-1 arrays can be converted to Python scalars
。我的理解是,fit函数不喜欢我提供的X
和Y
的格式。这让我感到困惑,因为在没有网格搜索的情况下,网络运行得很好,而且我没有对网络或数据做任何更改。有人能解释一下这是怎么回事,以及我该如何解决吗?
以下代码创建了网络和网格搜索:
#Creating the neural networkdef create_model(): model=Sequential() model.add(Dense(512, activation='relu',input_shape=(2606,))) model.add(Dense(256, activation='relu')) model.add(Dense(128, activation='relu')) model.add(Dense(64, activation='relu')) model.add(Dense(32, activation='relu')) model.add(Dense(16, activation='relu')) model.add(Dense(1, activation='relu')) opt=optimizers.Adam(lr=learn_rate) model.compile(optimizer=opt, loss='mean_squared_error', metrics=['accuracy']) #I commented this out because I believe it is delegated to the grid.fit() fn later on. #model.fit(X_train, Y_train, batch_size=30, epochs=6000, verbose=1) return model#Now setting up the grid searchmodel=KerasClassifier(build_fn=create_model())learn_rate=np.arange(.00001,.001,.00002).tolist()batch_size=np.arange(10,2606,2).tolist()epochs=np.arange(1000,10000,100).tolist()param_grid=dict(learn_rate=learn_rate, batch_size=batch_size, epochs=epochs)grid = GridSearchCV(estimator=model, param_grid=param_grid, n_jobs=-1, cv=3)grid_results=grid.fit(X_train,Y_train) #This is the line referenced in the error message.print("Best: %f using %s" % (grid_result.best_score_, grid_result.best_params_))
任何建议都将不胜感激!
编辑:X_train
数据的形状为(167,2606)
。167个元素中的每一个都是长度为2606的数组。这就是为什么网络的input_shape
为(2606,)
。而Y_train
的形状为(167,)
。
回答:
所以,问题在于GridSearchCV
为每种参数组合创建一个带有新参数的新模型。你传递了一个已经创建的模型和一个参数列表。我认为这就是数组与标量错误的来源。下面,我修改了你的代码(使用了一些垃圾样本数据),它将能够运行。
需要注意的主要更改是,我修改了你的create_model
函数的签名,使其接受你传递给GridSearch的参数值。我还移除了将KerasClassifier
实例赋值给变量model
的操作,而是将其调用作为GridSearchCV
中的估计器。