Home IT技术如何为词义消歧准备Weka数据

如何为词义消歧准备Weka数据

IT技术 xiaolong · 2025年4月12日 · 0 Comment

我想使用Weka进行词义消歧。我准备了一些文件，每个文件包含一个波斯语句子、一个制表符、一个波斯语单词、另一个制表符，然后是一个英语单词。这些文件在Notepad++中以txt格式保存。现在我应该如何使用这些文件来进行Weka操作？我应该如何修改它们？

样本文件：https://www.dropbox.com/s/o7wtvrvkiir80la/F.txt?dl=0

回答：

我找到了答案。文件应该有相同数量的列。所以我把句子放在引号中，然后用逗号分隔，接着是放在引号中的英语单词。在这些内容之上，我们应该写入适当的关系和属性。

machine-learning nlp rweka

发表回复取消回复