我正在尝试将我的输入时间序列数据分类到10个响应类别中。因此,我的响应特征中有10个类别。
我的输入数据有40个特征,而响应(y_train)有一个特征,包含10个类别。
train input shape (4320, 43), train_y shape (4320,)
我的LSTM网络看起来如下
model = Sequential()model.add(LSTM(25, dropout=0.2, input_shape=(train_X.shape[1], train_X.shape[2])))model.add(Dense(10, activation='softmax'))model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])history = model.fit(train_X, train_y, epochs=10, batch_size=36, validation_split =0.05)
然后我得到了一个错误
Error when checking target: expected dense_21 to have shape (10,) but got array with shape (1,)
我认为这是因为我的train_y
只有一个特征,而密集输出层期望有10个特征。如何使用categorical_entropy损失函数运行我的多类时间序列分类?
另外,一旦我将损失函数更改为sparse_categorical_entropy,它就运行得很顺畅。
model = Sequential()model.add(LSTM(25, dropout=0.2, input_shape=(train_X.shape[1], train_X.shape[2])))model.add(Dense(10, activation='softmax'))model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])history = model.fit(train_X, train_y, epochs=10, batch_size=36, validation_split =0.05)
请帮助我理解背后的原因。此外,对于多类分类时间序列,我应该使用哪种损失函数?
回答:
最初的错误:
Error when checking target: expected dense_21 to have shape (10,) but got array with shape (1,)
这是因为y_train
没有转换为分类度量。你需要清理y_train
数据,并通过例如独热编码将其转换为你期望的10个类别的分类数组。
简单来说,categorical_crossentropy
应该只用于独热编码的数据。
[1, 0, 0, 0][0, 1, 0, 0][0, 0, 1, 0]...
否则,sparse_categorical_crossentropy
处理的是整数。
1253...