我想在scikit进行交叉验证时计算微平均精度。
文档在这里:
http://scikit-learn.org/0.10/modules/cross_validation.html
说明你可以从metrics模块中传入一个自定义的评分函数,例如metrics.precision_score:
但默认情况下,它会为每个类别计算分数。如果我尝试像这样传入average="micro"
:
cross_validation.cross_val_score(clf, x, label, cv=5,score_func=metrics.precision_score(average="micro"))
我会收到以下错误:
TypeError: precision_score() takes at least 2 arguments (1 given)
我无法传入它需要的所有其他参数(y_true
, y_pred
),因为我不知道y_pred
是什么。
在scikit中进行交叉验证时,有没有办法获得微平均精度?
回答:
这里的问题是你实际上是在调用(使用参数average
)metrics.precision_score
,而不是传递函数本身。一个临时的解决方法是创建一个函数
def micro_average_precision_score(y_true, y_pred): return metrics.precision_score(y_true, y_pred, average="micro")
然后将其用作你的score_func
,即score_func=micro_average_precision_score
。
在重要的一点上:score_func
已被弃用(如果我没记错的话,从0.13
版本开始)。你参考的是scikit learn 0.10版本的文档。你使用的是这个版本吗?
传递评分器的新方法是使用评分器对象。相关的关键字是scoring=
而不是score_func=
。你可以使用make_scorer
将任何评分函数转换为评分器对象,例如上面定义的函数:
from sklearn.metrics.score import make_scorerscorer = make_scorer(micro_average_precision_score, greater_is_better=True)
或者,等效地:
scorer = make_scorer(metrics.precision_score, greater_is_better=True, average="micro")