在Kaggle上提交

Kaggle要求我们上传CSV文件,但我不知道如何操作。我已经有了一套完整的代码,可以生成预测结果,我需要将这些预测结果与它们的ID对应起来,并生成一个包含两个列的CSV文件(一列是ID,另一列是相应的预测结果)。我该怎么做?如果有人能提供一些示例Python代码来帮助我,那就太好了。

第一个是预测结果,以numpy数组的形式输出

array([ 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 0., 1., 0., 1., 1., 1., 0., 1., 0., 1., 0., 1., 1., 0., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 0., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 0., 1., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 1., 1., 0., 0., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 0., 1., 1., 1., 0., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 0., 0., 1., 1., 1., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1., 1., 0., 0., 1., 0., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 0., 1.])

第二个是z_test,它是一个通过以下方式给出的数据框

0 LP0010151 LP0010222 LP0010313 LP0010354 LP0010515 LP0010546 LP0010557 LP0010568 LP0010599 LP00106710 LP00107811 LP00108212 LP00108313 LP00109414 LP00109615 LP00109916 LP00110517 LP00110718 LP00110819 LP00111520 LP00112121 LP00112422 LP00112823 LP00113524 LP00114925 LP00115326 LP00116327 LP00116928 LP00117429 LP001176

337 LP002856338 LP002857339 LP002858340 LP002860341 LP002867342 LP002869343 LP002870344 LP002876345 LP002878346 LP002879347 LP002885348 LP002890349 LP002891350 LP002899351 LP002901352 LP002907353 LP002920354 LP002921355 LP002932356 LP002935357 LP002952358 LP002954359 LP002962360 LP002965361 LP002969362 LP002971363 LP002975364 LP002980365 LP002986366 LP002989

我需要将这两个数据合并成一个CSV文件。它们的大小都是(367,)。

附注:我有一个名为X_test的数据框,我需要对其进行预测,所以我使用.copy()方法将ID列复制到了z_test中。


回答:

你可以例如创建一个包含感兴趣列的Pandas数据框,并将其保存为CSV文件。

submission = pandas.DataFrame({    "LoanId": LoanId["LoanId"],    "Prediction": predictions.astype(int)})
submission.to_csv("kaggle.csv", index = False)

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注