从sklearn加载Iris数据集。将数据集拆分为训练和测试部分。从4个特征中选择2个。我编写了以下代码:
from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitiris = load_iris()X, y = iris.data, iris.targetX_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.33,random_state=42)
但我不明白“从4个特征中选择2个”是什么意思。是指test_size和random_state吗?还是其他什么意思?
回答:
Iris数据集有花瓣长度、花瓣宽度、花萼长度、花萼宽度4个特征。从4个特征中选择2个,意思是在你的训练模型中使用其中的两个特征。我不明白你为什么要这样做,因为使用所有四个特征会使模型更准确。