我有50个文件,每个文件包含一个多义词(即拼写相同但含义不同的词)的句子。实际上这是一个词义消歧项目。有些文件包含2个词义,有些包含3个,还有些包含4个。我使用朴素贝叶斯算法对它们进行了消歧。现在我需要计算F-measure。因为这是一个多分类任务,我需要计算宏平均和微平均。我的问题是,仅计算其中一个是否足够和科学,还是应该计算两个?并且,在计算了每个文件(每个多义词)的F-measure之后,我应该如何计算所有50个词的总F-measure,以便最后得到一个数字?(是否有必要计算总F-measure,还是只需分别计算每个词的F-measure,最后得到50个F-measure?)我需要这个数据用于我的论文,所以我希望得到专家的科学和正确的回答。谢谢。
回答:
在计算了每个词的宏平均或微平均之后,为了计算所有词的F-measure,我们需要将每个词的宏平均或微平均乘以下一个词的平均值(对所有50个词进行此操作),然后除以每个词的词义数量之和。