我在数据集上(文本分类类型)训练了LSTM和决策树。我使用了K折交叉验证,K=10。
决策树准确率61%LSTM准确率90%
现在当我在完全未见过的数据上进行预测时,决策树的预测效果比LSTM更好。
为什么会这样?如果LSTM的准确率更高,为什么决策树在未见数据上的表现比LSTM更好呢?
回答:
你的LSTM模型在训练时的准确率可能比决策树高,但它在未见数据上表现不佳的事实表明,LSTM可能对训练数据过拟合了。尝试调整训练-验证数据的分割比例和批次大小,看看是否能改善你的模型。
训练过程中的验证损失可以指示哪个模型表现更好。你也可以尝试使用随机森林(决策树集群),它已被证明在效果上优于单个决策树。