为什么我们要使用MinMaxScaler(),它做了什么?
scaler = MinMaxScaler()scaler.fit(X_train)X_train = scaler.transform(X_train)X_test = scaler.transform(X_test)model = LogisticRegression()model.fit(X_train, y_train)y_pred = model.predict(X_test)
回答:
方法的核心
Min-Max缩放器是一种标准化输入特征/变量的方法。通过这种方式,所有特征都将被转换到[0,1]
范围内,这意味着一个特征/变量的最小值和最大值分别为0和1。
为什么在模型拟合前进行标准化?
标准化/规范化的基本思想始终相同。在不同尺度上测量的变量对模型拟合和学习的模型函数的贡献是不平等的,可能会导致偏差。因此,为了应对这一潜在问题,通常在模型拟合之前使用像MinMax缩放这样的特征标准化方法。