假设我在评估一个文本分类研究项目,使用了两种方法’A’和’B’。使用方法’A’时,精度提高了x%,而使用方法’B’时,召回率提高了x%。我该如何判断A或B方法更好呢?
回答:
这取决于你的目标。如果你需要前几个返回的类别是正确的,那么你应该选择精度;如果你希望能返回所有相关的类别,那么你应该尝试提高召回率。
如果你既关心精度又关心召回率,那么通常使用的一个衡量指标是F1分数,它将精度和召回率结合成一个单一的度量标准。
假设我在评估一个文本分类研究项目,使用了两种方法’A’和’B’。使用方法’A’时,精度提高了x%,而使用方法’B’时,召回率提高了x%。我该如何判断A或B方法更好呢?
回答:
这取决于你的目标。如果你需要前几个返回的类别是正确的,那么你应该选择精度;如果你希望能返回所有相关的类别,那么你应该尝试提高召回率。
如果你既关心精度又关心召回率,那么通常使用的一个衡量指标是F1分数,它将精度和召回率结合成一个单一的度量标准。