我想问一些问题。
我在Python中使用1万条训练数据训练了我的sklearn逻辑回归分类器。我有2千条测试数据,并使用准确率评分来显示准确率和混淆矩阵,但两者都只显示所有测试数据的总体准确率。
我想要的是例如:
测试数据1:”abc”
给定测试数据时,类别A的准确率:80%
给定测试数据时,类别B的准确率:10%
给定测试数据时,类别C的准确率:10%
测试数据2:”def”
给定测试数据时,类别A的准确率:50%
给定测试数据时,类别B的准确率:30%
给定测试数据时,类别C的准确率:20%
以此类推,显示所有测试数据的结果。我希望以表格形式展示,如示例所示。
使用sklearn可以实现吗?
回答:
根据您提供的示例,我认为您想要的是每个测试数据点的概率预测。您可以使用LogisticRegression类的predict_proba
方法轻松实现(http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.predict_proba)。这将为您提供每个类别的概率。在您的情况下,返回的矩阵大小应为2000 x 3
。您可以将它们乘以100,以获得每个类别的必要百分比。
希望这对您有帮助。