线性回归 (sklearn) 数据形状拟合错误

我有一个关于 sklearn 线性回归模型的问题.. …

创建一个预测产品价格的回归模型

我有一些公司销售相同产品的特定数量和价格的数据,请参考…

自定义聚合原语支持附加参数吗?

转换原语在使用附加参数时运行良好。这里有一个示例 de…

使用RandomizedSearchCV在sklearn中进行超参数调优耗时过长

我正在处理一个包含13个特征和550068行的数据集。…

基于使用产品的客户细分应使用哪种机器学习模型

我正在尝试对客户运行机器学习模型,以根据他们使用的相似…

评分系统 – 输入特性

我正在开发一个评分系统(毕业项目)。我已经对数据进行了…

有人能告诉我最后一个循环在做什么吗?

已关闭。 此问题需要调试详情。目前不接受回答。 编辑问…

如何训练多标签正确的机器学习分类模型?

我有一个包含20个特征和8个可能标签的简单数据集。然而…

对具有异质变量的客户集进行聚类

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

独热编码是否能避免虚拟变量陷阱

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

比较Pandas数据框的列名

如何比较两个不同Pandas数据框的列名?我想比较训练…

Azure ML预测值恒定

我在使用位于https://gallery.azure…

使用Python对CSV文件进行训练-测试拆分

我有一个.csv文件,里面包含了我的数据。我想进行Lo…

如何仅对数据框中的分类数据进行编码

输入图片描述 如何仅对数据框中的分类数据进行编码 In…

为什么我在参数调优时的平均测试分数(交叉验证)低于保留测试集上的分数(RandomForestClassifier)?

我使用RandomizedSearchCV(sklea…

如何在特定类别样本为0的情况下对不平衡数据集进行分类?

基本上,我有一个给定的训练集和测试集,我将在训练集上测…

如何将数据库中的员工职称匹配以简化名称

已关闭。此问题需要更加集中。目前不接受回答。 想要改进…

如何在GridSearchCV中对数据进行标准化?

如何在GridSearchCV中对数据进行标准化? 这…

pyspark.ml pipelines: 基本预处理任务是否需要自定义转换器?

在开始使用pyspark.ml和管道API时,我发现自…

1D数据序列中是否存在多个聚类?

一系列数值可能存在也可能不存在聚类。例如: [1, 2…

在 scikit-learn 中,fit()、fit_transform() 和 transform() 有什么区别? [duplicate]

这个问题已经有了答案: 在 sklearn 中 &#8…

选择最可能选项的决策树?

我在尝试寻找合适的机器学习算法。假设我有三列数据。每列…

在构建机器学习模型时,是否应该删除整列值都相同的变量?

例如,列x有50个值,但所有这些值都是相同的。 删除这…

我在乎新数据上的无偏准确率估计吗?

我理解为什么我们需要训练集、验证集和测试集。简而言之:…

什么是RepeatedKFold的实际含义?

假设n_repeats=5 且折叠数为3 (n_spl…