如何使独热编码转换永久生效

我的数据集中有16个分类变量。我希望对其中一些变量应用…

深度学习多类分类,哪个必须保持一致,实例数量还是图像数量?

我正在使用Mask R-CNN训练一个包含两类的模型,…

如何使用pyplot绘制时间?

我有一个包含两列的CSV文件,一列是工作日的名称,另一…

使用Python的高错误机器学习回归算法 – XGBOOST回归

我有一个包含佛罗里达州房地产数据的数据框架,其中包括单…

如何将训练和测试数据集组合成相同格式

我正在练习使用这个数据集:http://archive…

混淆矩阵显示错误信息?

更新:附上数据链接,以防你想重现: https://g…

在Windows上安装TensorFlow时遇到异常错误

我正在积极尝试进入机器学习领域,但在我的系统上安装Te…

如何从普通的机器学习技术转向交叉验证?

from sklearn.svm import Lin…

有人能解释一下Python sklearn中标准化缩放器的功能吗?

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

如何解决这个错误:ValueError: not enough values to unpack (expected 4, got 3)?

我正在使用这个链接中提到的学习曲线代码路径。 http…

Pipeline和GridSearchCV,以及XGBoost和RandomForest的多类别挑战

我正在使用Pipeline和GridSearchCV进…

从数据集中排除噪声数据来训练模型是否是个好主意?

从数据集中排除噪声数据(这可能会降低模型的准确性或导致…

scikit learn中的DecisionTree分类器特征返回值-2,意味着什么

DecisionTreeClassifier和Deci…

如何在不欠拟合或过拟合的情况下实现回归模型

我在大学项目中获得了一个数据集,其中几乎所有特征与目标…

使用Pipeline和GridSearchCV计算平均绝对误差(MAE)

我在使用Pipeline和GridSearchCV查找…

从新闻博客中提取特征

我刚开始接触数据科学/机器学习。我需要编写一个网络爬虫…

如何修复二元分类中非常高的假阴性率?

我有一个项目,需要根据大约52个特征和2000行的数据…

在生成文档术语矩阵之前还是之后拆分测试集和训练集?

我在处理简单的机器学习问题,试图构建一个能够区分垃圾短…

在对多数类进行欠采样后,训练集是否可以小于测试集?

我有一个包含1500条记录的数据集,分为两个类别,且类…

可以对训练集中的分类数据进行编码,但不能对测试集进行编码

我需要对测试集中的分类值进行编码,但不知为何它抛出了T…

如何使用Python根据输入值分割数组

假设在KNN中折叠值为N,我们需要将数组分成N等份,并…

使用Altair创建自定义置信区间的折线图

假设我有以下数据框架: 我查看了文档,但它仅基于单列数…

解决分类问题时,应当使用哪些数据可视化技术来分析数据?

我在解决一个分类问题时,找不到合适的可视化方法来分析我…

交叉验证与改进

我想知道交叉验证过程如何改进模型。我在这个领域完全是新…

如何在机器学习模型标准化后预测新值 StandardScaler

我正在开发一个机器学习模型,我有一个包含数据的数据框 …