我有一段有些
能用的代码,但它给我带来了麻烦。我似乎得到一个几乎随机的accuracy_score指标,而我打印出来的预测值却表明情况并非如此。我在网上按照这个教程进行操作,以下是我目前编写的内容:
我很困惑,我无法判断我的数据框拼接是否正常工作,或者accuracy_score指标是否在解决其他问题,因为我得到的输出如下所示:
在这个特定实例中,它显示有7个真负例(正常),1个假正例(???),2个假负例(正常),和0个真正例(???,但有一个猜对了?)。[classs]列是[Prediction]列所猜测的对象。
回答:
result = pd.concat([adult_train, Prediction], axis=1)
这里Prediction数据框不应该与adult_train拼接,Prediction是对测试集数据集进行预测的结果
pred_gnb = gnb.predict(data_test)
所以,我认为你应该拼接data_test、target_test和Prediction,试试这个方法可能会有效
result = pd.concat([pd.DataFrame(data_test), pd.DataFrame(target_test), Prediction], axis=1)