我正在进行一个项目,需要判断一个词是否是水果。我尝试了几种方法,但对结果都不满意。有没有建议?
我的训练集看起来像这样
- 输入:苹果是一种水果。 输出:苹果。
- 输入:番石榴也是一种水果 输出:番石榴。
- 输入:菠萝是一种季节性水果 输出:菠萝。
在训练数据之外运行的示例:
- 输入:我喜欢所有的水果,但最喜欢的是番石榴和苹果。 输出:番石榴,苹果
回答:
这项任务被称为命名实体识别。你可以从维基百科开始了解更多信息。
一个流行的库是来自斯坦福的CoreNLP。你可以在斯坦福自然语言处理小组的网站上了解更多信息。
为了使用它,你需要在你的训练数据中标记每个标记(单词),指出它是否是水果。希望这对你有帮助。