将文本分类到多个类别中

我正在进行一个项目,需要判断一个词是否是水果。我尝试了几种方法,但对结果都不满意。有没有建议?

我的训练集看起来像这样

  • 输入:苹果是一种水果。 输出:苹果。
  • 输入:番石榴也是一种水果 输出:番石榴。
  • 输入:菠萝是一种季节性水果 输出:菠萝。

在训练数据之外运行的示例:

  • 输入:我喜欢所有的水果,但最喜欢的是番石榴和苹果。 输出:番石榴,苹果

回答:

这项任务被称为命名实体识别。你可以从维基百科开始了解更多信息。

一个流行的库是来自斯坦福的CoreNLP。你可以在斯坦福自然语言处理小组的网站上了解更多信息。

为了使用它,你需要在你的训练数据中标记每个标记(单词),指出它是否是水果。希望这对你有帮助。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注