Kaggle要求我们上传CSV文件,但我不知道如何操作。我已经有了一套完整的代码,可以生成预测结果,我需要将这些预测结果与它们的ID对应起来,并生成一个包含两个列的CSV文件(一列是ID,另一列是相应的预测结果)。我该怎么做?如果有人能提供一些示例Python代码来帮助我,那就太好了。
第一个是预测结果,以numpy数组的形式输出
array([ 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 0., 1., 0., 1., 1., 1., 0., 1., 0., 1., 0., 1., 1., 0., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 0., 1., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 0., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 0., 1., 1., 1., 0., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1.])
第二个是z_test,它是一个通过以下方式给出的数据框
0 LP0010151 LP0010222 LP0010313 LP0010354 LP0010515 LP0010546 LP0010557 LP0010568 LP0010599 LP00106710 LP00107811 LP00108212 LP00108313 LP00109414 LP00109615 LP00109916 LP00110517 LP00110718 LP00110819 LP00111520 LP00112121 LP00112422 LP00112823 LP00113524 LP00114925 LP00115326 LP00116327 LP00116928 LP00117429 LP001176
337 LP002856338 LP002857339 LP002858340 LP002860341 LP002867342 LP002869343 LP002870344 LP002876345 LP002878346 LP002879347 LP002885348 LP002890349 LP002891350 LP002899351 LP002901352 LP002907353 LP002920354 LP002921355 LP002932356 LP002935357 LP002952358 LP002954359 LP002962360 LP002965361 LP002969362 LP002971363 LP002975364 LP002980365 LP002986366 LP002989
我需要将这两个数据合并成一个CSV文件。它们的大小都是(367,)。
附注:我有一个名为X_test的数据框,我需要对其进行预测,所以我使用.copy()方法将ID列复制到了z_test中。
回答:
你可以例如创建一个包含感兴趣列的Pandas数据框,并将其保存为CSV文件。
submission = pandas.DataFrame({ "LoanId": LoanId["LoanId"], "Prediction": predictions.astype(int)})
submission.to_csv("kaggle.csv", index = False)