我正在尝试为R中的germancredit数据框计算信用评分。我使用线性SVM分类器来预测0和1(即0 = 好,1 = 坏)。
我通过以下代码成功地从SVM分类器中产生了概率。
final_pred = predict(classifier, newdata = data_treated[1:npredictors], decision.values = TRUE, probability = TRUE)probs = attr(final_pred,"probabilities")
我想知道如何读取这些概率输出。样本输出如下。这是否意味着,如果预测为1(违约)在第五行,那么概率为0.53601166。
0 1 Prediction1 0.90312125 0.09687875 02 0.57899408 0.42100592 03 0.93079172 0.06920828 04 0.76600082 0.23399918 05 0.46398834 0.53601166 1
我能否使用上述相应的概率来开发信用评分卡,就像我们通常使用逻辑回归模型那样?
回答:
您会得到结果0或1的概率。每行的前两列之和为1,给出总体概率。您的解释在我看来是正确的,即当概率为0.53时,发生违约的可能性比没有违约的可能性(p = 0.46)更大。
是的,您可以使用该模型来开发信用评分卡。请注意,您不一定需要使用0.5作为决定公司或个人X是否会违约的 cutoff 值。