我在sklearn
中构建了一个模型,并将其保存为pickle格式。为了获得最佳结果,我不得不移除一些特征,创建新的特征,使用独热编码等方法。
现在,我得到了一个新的初始形式的数据点,需要进行预测。有没有简单的方法可以转换这个数据点,使我的模型能够进行预测呢?
回答:
你需要对测试集应用与训练集相同的转换方法。一种做法是编写一个处理数据的函数并使用它。这样你将得到类似以下的代码:
def process_data(x): # 处理数据,移除特征等
return processed_data
X_train_processed = process(X_train)
X_test_processed = process(X_test)