我想使用Weka进行词义消歧。我准备了一些文件,每个文件包含一个波斯语句子、一个制表符、一个波斯语单词、另一个制表符,然后是一个英语单词。这些文件在Notepad++中以txt格式保存。现在我应该如何使用这些文件来进行Weka操作?我应该如何修改它们?
样本文件:https://www.dropbox.com/s/o7wtvrvkiir80la/F.txt?dl=0
回答:
我找到了答案。文件应该有相同数量的列。所以我把句子放在引号中,然后用逗号分隔,接着是放在引号中的英语单词。在这些内容之上,我们应该写入适当的关系和属性。