如何解读机器学习训练输出

我是一名机器学习的初学者,正在通过参加Kaggle竞赛来学习。我从著名的泰坦尼克号生存问题开始,通过试错和向他人求助,我已经能够训练我的数据,但我的问题是:如何理解输出结果并继续进行下一步?

这是我的代码:

import pandas as pdfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.model_selection import train_test_splittrain_path = "C:\\Users\\Omar\\Downloads\\Titanic Data\\train.csv"train_data = pd.read_csv(train_path)train_data['Sex'] = pd.factorize(train_data.Sex)[0]columns_of_interest = ['Survived','Pclass', 'Sex', 'Age']filtered_titanic_data = train_data.dropna(axis=0)x = filtered_titanic_data[columns_of_interest]y = filtered_titanic_data.Survivedtrain_x, val_x, train_y, val_y = train_test_split(x, y, random_state=0)titanic_model = DecisionTreeRegressor()titanic_model.fit(train_x, train_y)val_predictions = titanic_model.predict(val_x)print(val_predictions)

这是我得到的输出(1表示生还 – 0表示死亡):

1. 0. 1. 0. 1. 0. 0. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 1. 1. 0. 0. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 1. 0. 1.

但我不知道如何利用这个输出继续进行下一步。


回答:

你现在可以将你的val_predictionsval_y进行比较,看看你预测对了多少!

你使用train_x, train_y来寻找模式,然后在val_x上进行拟合,现在你想看看你的模型表现如何!

有很多方法可以做到这一点!你可以选择你的评估指标!

from sklearn.metrics import accuracy_scoreaccuracy_score(val_predictions, val_y)

这是accuracy_score代表什么的链接! http://scikit-learn.org/stable/modules/model_evaluation.html#accuracy-score

准确率评分是一种评估指标!接下来,你还可以使用GridSearchCV来自动搜索最佳参数,以最大化或最小化你的评估指标。

你可以在这里阅读相关内容:

  1. http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
  2. https://stats.stackexchange.com/questions/269300/why-does-sklearn-grid-search-gridsearchcv-return-random-results-on-every-executi

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注