我的机器学习模型使用的是cleaveland数据库,包含300行和14个属性——用于预测一个人是否患有心脏病。但我的目标是基于逻辑回归创建一个分类模型。我对数据进行了预处理,并使用x_train, Y_train, X_test, Y_test运行了模型,获得了平均82%的准确率…
为了提高准确率,我删除了高度相关的特征[因为它们提供的信息是重复的]
然后我进行了RFE[递归特征消除]
接着使用PCA[主成分分析]进行降维…
尽管如此,我的模型准确率并没有明显改善..
这是为什么呢?
另外,为什么我的模型每次显示的准确率都不同?是因为每次使用的x_train, Y_train, X_test, Y_test都不同吗?
我应该更换模型来获得更好的准确率吗?80%的平均准确率是好还是坏?
回答:
尝试使用穷举网格搜索或随机参数优化来调整你的超参数。