我想使用 train_test_split(X, y, test_size = 0.2)
,但我不希望数据是随机的——我希望前80%的数据作为训练集,后20%的数据作为测试集。这可以实现吗?
回答:
我原本以为即使关闭了初始shuffle,train_test_split
仍然会使用随机性。实际上,这可以通过一个简单的 shuffle=False
参数来解决:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42,shuffle=False)