我训练了一个简单的随机森林分类器,然后在使用相同的测试输入进行预测时:
rf_clf.predict([[50,0,500,0,20,0,250000,1.5,110,0,0,2]])rf_clf.predict_proba([[50,0,500,0,20,0,250000,1.5,110,0,0,2]])
第一行返回array([1.])
,而第二行返回array([[0.14, 0.86]])
,其中预测值是第一个浮点数0.14
,对吗?
为什么这两者不匹配?我有点困惑。谢谢。
回答:
predict()
函数返回特征所属的类别,而predict_proba()
函数返回特征属于不同输出类别的概率。
示例:predict()
函数的输出结果表明特征属于类别1,即array([1.])
predict_proba()
函数的输出结果给出了特征属于每个输出类别的概率,即array([[0.14, 0.86]])
。特征属于类别0的概率为14%,属于类别1的概率为86%。