fit() 函数在这里到底做了什么?

我想了解 fit() 函数的一般功能,尤其是在下面的代码片段中它具体做了什么。

我正在学习机器学习A-Z课程,因为我对机器学习还比较陌生(我刚开始学)。我知道一些基本概念术语,但不太了解技术部分。

代码1:

from sklearn.impute import SimpleImputermissingvalues = SimpleImputer(missing_values = np.nan, strategy = 'mean', verbose = 0) missingvalues = missingvalues.fit(X[:, 1:3])X[:, 1:3] = missingvalues.transform(X[:, 1:3])

另一个让我仍然有疑问的例子

代码2:

from sklearn.preprocessing import StandardScalersc_X = StandardScaler()print(sc_X)X_train = sc_X.fit_transform(X_train)print(X_train)X_test = sc_X.transform(X_test)

我认为如果我能了解这个函数的一般用途以及它通常做什么,我就可以继续了。但我当然也想知道它在这些代码中具体做了什么


回答:

这里还有一个不错的检查机会: https://scikit-learn.org/stable/tutorial/basic/tutorial.html

fit方法在机器学习中总是用来学习某些东西的。

你通常会有以下步骤:

  1. 将你的数据分成两个或三个数据集
  2. 选取数据的一部分来学习/训练某些东西(通常是 X_train)并使用 fit
  3. 使用学到的算法对未见过的数据(通常是 X_test)进行预测,使用 predict

在你的第一个例子中:missingvalues.fit(X[:, 1:3]) 你是在根据数据 X 训练 SimpleImputer,其中你只使用了第 1,2,3 列,然后用 transform 将这个训练结果应用到这些数据上,进行覆盖。

在你的第二个例子中:你是在用 X_train 训练 StandardScaler,并将这个训练结果应用到两个数据集 X_trainX_test 上,StandardScaler 从 X_train 中学习到,如果它学到10需要转换为2,那么它会在 X_trainX_test 两个集合中都将10转换为2。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注