我想弄清楚我使用的代码是计算精确度还是准确度,或者两者都计算。由于我在统计学方面的背景有限(而且是用另一种语言学的),我很难理解维基百科上关于这个主题的文章。
具体来说,我使用以下Python代码:
from sklearn import svm, cross_validationclf = svm.SVC(kernel=kernel, C=C)scores = cross_validation.cross_val_score(clf, FeatureMatrix, np.squeeze(LabelMatrix), cv=d_inds)
关于scikit-learn函数的文档可以在这里找到:
回答:
默认情况下,cross_val_score
使用分类器的score
方法(对于SVC来说,这是准确度)。如果你想指定其他度量标准,可以在scoring
参数中传入,例如cross_val_score(clf, X, y, scoring = 'precision')
。要查看所有评分选项的完整列表,请访问http://scikit-learn.org/stable/modules/model_evaluation.html