多分类任务中F-measure的宏平均和微平均

我有50个文件,每个文件包含一个多义词(即拼写相同但含义不同的词)的句子。实际上这是一个词义消歧项目。有些文件包含2个词义,有些包含3个,还有些包含4个。我使用朴素贝叶斯算法对它们进行了消歧。现在我需要计算F-measure。因为这是一个多分类任务,我需要计算宏平均和微平均。我的问题是,仅计算其中一个是否足够和科学,还是应该计算两个?并且,在计算了每个文件(每个多义词)的F-measure之后,我应该如何计算所有50个词的总F-measure,以便最后得到一个数字?(是否有必要计算总F-measure,还是只需分别计算每个词的F-measure,最后得到50个F-measure?)我需要这个数据用于我的论文,所以我希望得到专家的科学和正确的回答。谢谢。


回答:

在计算了每个词的宏平均或微平均之后,为了计算所有词的F-measure,我们需要将每个词的宏平均或微平均乘以下一个词的平均值(对所有50个词进行此操作),然后除以每个词的词义数量之和。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注