支持向量回归(SVR)管道的无效参数

我有一个包含100列连续特征和一个连续标签的数据集,我…

在实现FAMD和SMOTENC的imblearn管道时遇到AttributeError

我在尝试实现一个包含FAMD、SMOTENC和其他预处…

如何从xgboost中获取类似glm的比值比?

我在Python 3.8.5上使用xgboost成功运…

使用Sickit learn进行一对多优化求解器

我正在尝试使用逻辑回归解决一个多类分类问题。我的数据集…

查看单个预测的模型系数

我有一个包含在scikit-learn管道中的逻辑回归…

理解scikit-learn的ValueError:由于数据形状导致的尝试用序列设置数组元素

在过去的两天里,我一直在努力寻找一种正确的方式来调整和…

你好,关于使用自定义变换器处理时间序列的sklearn.Pipeline有两个问题

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

使用不平衡数据集进行特征选择时遇到的问题

我正在使用不平衡数据集(54:38:7%)进行特征选择…

tfidf.idf_ 在代码中的含义是什么

已关闭。这个问题需要更多细节或更清晰。目前不接受回答。…

我是否正确使用了装饰器?

我不确定如何正确使用装饰器;我参考了Real Pyth…

为什么sklearn中的SGDRegressor函数无法收敛到正确的极值?

我在练习使用sklearn中的SGDRegressor…

Scikit-learn – 我要预测什么?

我的目标是根据包含六列的csv数据,预测一个数组中五到…

预处理、重采样和管道 – 以及中间的错误

我有一个数据集,包含不同类型的变量:二元、分类、数值、…

默认标准化所有特征是否是个坏主意?

已关闭。 此问题不符合Stack Overflow 指…

为什么Scikit-learn的RFECV在训练数据集上返回的特征差异很大?

我一直在使用波士顿数据集进行RFECV实验。 据我目前…

sklearn模型中的随机性丢失

我遇到了一个非常奇怪的情况。 我正在尝试使用sklea…

sklearn的roc_curve()函数返回不同维度的阈值和假阳性率

我认为roc_curve()函数是为每个阈值计算假阳性…

LightGBM在数值+分类+文本特征上的应用 >> TypeError: Unknown type of parameter:boosting_type, got:dict

我正在尝试在一个包含数值、分类和文本数据的数据集上训练…

Pipeline using multiple columns

我有一个二分类问题。我的数据集包含不同类型的列:二元(…

OneHotEncoder导致标题丢失

我在使用泰坦尼克号数据集构建机器学习模型时,使用了On…

XGBoost预测概率的推理性能缓慢

我在相同的数据集上使用Scikit-learn和XGB…

为什么相同的xgboost树路径会给出两种不同的预测?

我在尝试研究xgboost的预测结果。 看起来两个具有…

为什么在主成分分析中需要指定保留的成分数量?

我发现使用PCA时,需要在一开始就指定保留的成分数量,…

如何在训练好的模型上对新句子进行情感分析?

我使用朴素贝叶斯训练了一个模型,准确率很高,但现在我想…

在使用scikit-learn进行LDA降维时出现错误

我已经从这个URL导入了数据集到pandas数据框中,…