“Stemming and Lemmatization with Python NLTK for both language as English and Russia”
来源: http://text-processing.com/demo/stem/
我想使用Python NLTK库来进行英语和俄语的词干提取。
您能否建议我使用哪个库来完成这项任务?
回答:
关于词干提取:
NLTK有Porter Stemmer,这是广泛使用的工具。
对于俄语,有人似乎使用了Snowball Stemmer。
关于词形还原:
我更倾向于使用SpaCy进行词形还原。
对于俄语,有人正在这里进行相关工作。
另一个用于俄语文本的词形还原工具可以在这里找到。