我是一名深度学习的初学者,正在尝试通过对数据集进行音频分析来实践在Python中实现神经网络。我一直在按照Urban Sound Challenge教程进行学习,并且已经完成了模型训练的代码,但在尝试在测试集上运行模型时不断遇到错误。
这是我创建和训练模型的代码:
import numpy as npfrom sklearn.preprocessing import LabelEncoderfrom keras.utils import np_utilsfrom keras.models import Sequentialfrom keras.layers import Dense, Dropout, Activation, Flattennum_labels = y.shape[1]filter_size = 2model = Sequential()model.add(Dense(256, input_shape = (40,)))model.add(Activation('relu'))model.add(Dropout(0.5))model.add(Dense(num_labels))model.add(Activation('softmax'))model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer='adam')model.fit(X, y, batch_size=32, epochs=40, validation_data=(val_X, val_Y))
在拟合模型之前运行model.summary()得到以下结果:
_________________________________________________________________Layer (type) Output Shape Param # =================================================================dense_3 (Dense) (None, 256) 10496 _________________________________________________________________activation_3 (Activation) (None, 256) 0 _________________________________________________________________dropout_2 (Dropout) (None, 256) 0 _________________________________________________________________dense_4 (Dense) (None, 10) 2570 _________________________________________________________________activation_4 (Activation) (None, 10) 0 =================================================================Total params: 13,066Trainable params: 13,066Non-trainable params: 0_________________________________________________________________
在拟合模型后,我尝试在一个文件上运行模型,以便对声音进行分类。
file_name = ".../UrbanSoundClassifier/test/Test/5.wav"test_X, sample_rate = librosa.load(file_name,res_type='kaiser_fast')mfccs = np.mean(librosa.feature.mfcc(y=test_X, sr=sample_rate, n_mfcc=40).T,axis=0)test_X = np.array(mfccs)print(model.predict(test_X))
然而,我得到了以下错误:
ValueError: Error when checking : expected dense_3_input to have shape
(None, 40)但得到的数组形状为(40, 1)
请问有人可以指导我如何正确地测试模型吗?我不知道model.predict()
的输入应该是什么。
完整代码可在此处找到:这里。
回答:
所以:
-
最简单的解决方法是简单地重塑
test_x
:test_x = test_x.reshape((1, 40))
-
更复杂的方法是重用你用于创建
train
和valid
集合的管道,也用于测试集。请注意,你对数据文件应用的过程在test
的情况下完全不同。我会创建一个测试数据框架:test_dataframe = pd.DataFrame({'filename': ["这里是测试文件的路径"]}
然后重用现有的用于创建验证集的管道。