我正在尝试进行有毒评论分类。我在https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge找到了一个数据集。该数据集包含许多带有标签类别值的评论,如“toxic”、“severe_toxic”等。我希望将我的单个文本输入分类到相应的标签类别。我已经使用LSTM创建并训练了一个模型。现在我想将一个单一的文本句子作为输入提供给模型以预测输出。但我不知道如何转换文本输入并将其提供给已训练的模型。
源代码来自kaggle挑战赛。
回答:
可以使用predict()
函数进行预测,如下所示:
y_predict = model.predict(X_te, batch_size=batch_size)
其中,X_te
是预处理后的测试集。预处理通常对训练集和测试集是相同的。
如果您想对测试集中单个实例进行预测,输入需要进行重塑,如下所示:
y_pred = model.predict(X_te[0].reshape(200,))