如何解读机器学习训练输出

我是一名机器学习的初学者,正在通过参加Kaggle竞赛来学习。我从著名的泰坦尼克号生存问题开始,通过试错和向他人求助,我已经能够训练我的数据,但我的问题是:如何理解输出结果并继续进行下一步?

这是我的代码:

import pandas as pdfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.model_selection import train_test_splittrain_path = "C:\\Users\\Omar\\Downloads\\Titanic Data\\train.csv"train_data = pd.read_csv(train_path)train_data['Sex'] = pd.factorize(train_data.Sex)[0]columns_of_interest = ['Survived','Pclass', 'Sex', 'Age']filtered_titanic_data = train_data.dropna(axis=0)x = filtered_titanic_data[columns_of_interest]y = filtered_titanic_data.Survivedtrain_x, val_x, train_y, val_y = train_test_split(x, y, random_state=0)titanic_model = DecisionTreeRegressor()titanic_model.fit(train_x, train_y)val_predictions = titanic_model.predict(val_x)print(val_predictions)

这是我得到的输出(1表示生还 – 0表示死亡):

1. 0. 1. 0. 1. 0. 0. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 1. 1. 0. 0. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 1. 0. 1.

但我不知道如何利用这个输出继续进行下一步。


回答:

你现在可以将你的val_predictionsval_y进行比较,看看你预测对了多少!

你使用train_x, train_y来寻找模式,然后在val_x上进行拟合,现在你想看看你的模型表现如何!

有很多方法可以做到这一点!你可以选择你的评估指标!

from sklearn.metrics import accuracy_scoreaccuracy_score(val_predictions, val_y)

这是accuracy_score代表什么的链接! http://scikit-learn.org/stable/modules/model_evaluation.html#accuracy-score

准确率评分是一种评估指标!接下来,你还可以使用GridSearchCV来自动搜索最佳参数,以最大化或最小化你的评估指标。

你可以在这里阅读相关内容:

  1. http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
  2. https://stats.stackexchange.com/questions/269300/why-does-sklearn-grid-search-gridsearchcv-return-random-results-on-every-executi

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注