在Kaggle上提交

Kaggle要求我们上传CSV文件,但我不知道如何操作。我已经有了一套完整的代码,可以生成预测结果,我需要将这些预测结果与它们的ID对应起来,并生成一个包含两个列的CSV文件(一列是ID,另一列是相应的预测结果)。我该怎么做?如果有人能提供一些示例Python代码来帮助我,那就太好了。

第一个是预测结果,以numpy数组的形式输出

array([ 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 0., 1., 0., 1., 1., 1., 0., 1., 0., 1., 0., 1., 1., 0., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 0., 1., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 0., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 0., 1., 1., 1., 0., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1.])

第二个是z_test,它是一个通过以下方式给出的数据框

0 LP0010151 LP0010222 LP0010313 LP0010354 LP0010515 LP0010546 LP0010557 LP0010568 LP0010599 LP00106710 LP00107811 LP00108212 LP00108313 LP00109414 LP00109615 LP00109916 LP00110517 LP00110718 LP00110819 LP00111520 LP00112121 LP00112422 LP00112823 LP00113524 LP00114925 LP00115326 LP00116327 LP00116928 LP00117429 LP001176

337 LP002856338 LP002857339 LP002858340 LP002860341 LP002867342 LP002869343 LP002870344 LP002876345 LP002878346 LP002879347 LP002885348 LP002890349 LP002891350 LP002899351 LP002901352 LP002907353 LP002920354 LP002921355 LP002932356 LP002935357 LP002952358 LP002954359 LP002962360 LP002965361 LP002969362 LP002971363 LP002975364 LP002980365 LP002986366 LP002989

我需要将这两个数据合并成一个CSV文件。它们的大小都是(367,)。

附注:我有一个名为X_test的数据框,我需要对其进行预测,所以我使用.copy()方法将ID列复制到了z_test中。


回答:

你可以例如创建一个包含感兴趣列的Pandas数据框,并将其保存为CSV文件。

submission = pandas.DataFrame({    "LoanId": LoanId["LoanId"],    "Prediction": predictions.astype(int)})
submission.to_csv("kaggle.csv", index = False)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注