Home IT技术如何使用sklearn.datasets.make_classification在指定范围内生成合成数据？

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据？

IT技术 xiaolong · 2025年5月25日 · 0 Comment

我想为分类问题创建合成数据。我使用了sklearn.datasets中的make_classification方法。我希望数据在特定的范围内，比如[80, 155]，但它却生成了负数。

我尝试了scale和class_sep参数的多种组合，但没有得到想要的结果。


输出

输出应该在特定范围内，但它却随机选择了标准偏差约为1.33的值。

回答：
您可以使用MinMaxScaler（请参见文档）。
只需运行以下代码：
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range=(80, 155))
X = scaler.fit_transform(X)
y = scaler.fit_transform(y)
请注意，该缩放器将为X和y各训练一次。



相关文章：

在 scikit-learn 中，fit()、fit_transform() 和 transform() 有什么区别？ [duplicate]
评分系统 – 输入特性
线性回归 (sklearn) 数据形状拟合错误
scikit learn: 5折交叉验证与训练测试拆分
使用sklearn对数据集的列进行二值化后，结果不正确。代码哪里出错了？
sklearn的PCA逆变换，维度错误
绘制scikit-learn (sklearn) SVM决策边界/表面
多类分类器的增量学习或在线学习
使用 XGBoost 进行超参数网格搜索 – 评分函数与评估指标
自定义转换器在sklearn中的应用



	

		 data-science machine-learning python scikit-learn





	
		
		
	





	
		
		
			xiaolong
			
		
					
	



		
			Related Posts
			
									
	

		

	
		IT技术 			

	使用LSTM在Python中预测未来值
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		这段代码可以预测指定股票的当前日期之前的值，但不能预测… 
	



									
	

		

	
		IT技术 			

	如何在gensim的word2vec模型中查找双词组的相似性
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我有一个word2vec模型，假设我使用的是googl… 
	



									
	

		

	
		IT技术 			

	dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我试图使用 XGBoost 创建模型。 看起来我成功地… 
	



									
	

		

	
		IT技术 			

	ML Tuning – Cross Validation in Spark
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在https://spark.apache.org/… 
	



									
	

		

	
		IT技术 			

	如何在React JS中使用fetch从REST API获取预测
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我正在开发一个应用程序，其中Flask REST AP… 
	



									
	

		

	
		IT技术 			

	如何分析ML.NET中多类分类预测得分数组？
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在ML.NET中创建了一个多类分类项目。该项目可以对… 
	



							

		


	


		
		发表回复 取消回复
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 * 
显示名称 * 
邮箱 * 
网站 
 在此浏览器中保存我的显示名称、邮箱地址和网站地址，以便下次评论时使用。






	
	搜索


标签


2d-vector
a-star
algorithm
apache-spark
artificial-intelligence
auto-keras
bilstm
c#
c++
classification
cluster-analysis
computer-vision
conv-neural-network
cox-regression
cross-validation
data-mining
data-science
decision-tree
deep-learning
geopandas
gradient-descent
image-processing
java
keras
libsvm
linear-regression
logistic-regression
machine-learning
matlab
neural-network
nlp
numpy
openai-api
opencv
pandas
python
python-3.x
pytorch
random-forest
recurrent-neural-network
reinforcement-learning
scikit-learn
statistics
tensorflow
weka


近期文章


使用LSTM在Python中预测未来值
如何在gensim的word2vec模型中查找双词组的相似性
dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
ML Tuning – Cross Validation in Spark
如何在React JS中使用fetch从REST API获取预测



分类


	IT技术


	
	

		
		

		

			

				
			
			
				
				© 2025 学技术
			京ICP备20017344号-7