我想为分类问题创建合成数据。我使用了sklearn.datasets
中的make_classification
方法。我希望数据在特定的范围内,比如[80, 155]
,但它却生成了负数。
我尝试了scale
和class_sep
参数的多种组合,但没有得到想要的结果。
输出
输出应该在特定范围内,但它却随机选择了标准偏差约为1.33的值。
回答:
您可以使用MinMaxScaler
(请参见文档)。
只需运行以下代码:
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range=(80, 155))
X = scaler.fit_transform(X)
y = scaler.fit_transform(y)
请注意,该缩放器将为X和y各训练一次。