Graphviz可以显示独热编码的分类数据吗?

我在尝试使用Graphviz展示我的独热编码分类数据,…

获取GBDT模型树信息

我正在使用GBDT来自sklearn,我想知道是否有方…

决策树未能捕捉因变量的方差

我正在使用决策树回归器进行工作。数据点数量为15000…

可以标准化我的PCA应用计数向量吗?

我已经在X_train上应用了CountVectori…

训练和测试准确率图表显示出奇怪的行为

我正在尝试为二分类问题构建决策树分类器。我的数据集是不…

我在使用knn进行分类任务时,数据集是否需要归一化或标准化?

我在尝试使用knn进行分类任务,我的数据集包含经过独热…

堆叠分类器的分类器数量是否必须等于训练/测试数据集的列数?

我正在尝试解决一个二分类任务。训练数据集包含9个特征,…

基于单一特征集的分类准确性

我正在尝试根据预先指定的标签对数据进行分类。 以下是两…

如何让文本对象与sklearn分类器管道一起工作?

目标:当模型输入是整数、浮点数和对象(根据pandas…

标准化主成分的KMeans聚类图

我有一个新数据集,其中包含一个数据集的前五个标准化主成…

从逻辑回归系数中推导出新的连续变量

我有一组自变量X和一组因变量Y的值。任务是进行二项分类…

在Python中基于较小的数据集生成更大的合成数据集

我有一个包含21000行(数据样本)和102列(特征)…

使用互信息回归进行特征选择时出现重塑错误

我试图使用带有SelectKBest包装器的mutua…

将数据框通过k-means传递时出现错误

尽管我的数据框中所有值都是浮点数,但在通过k-mean…

local outlier factor实世界示例

我已经学习了局部离群因子,但我想知道它在现实世界中的应…

如何自动确定聚类数量?

我一直在尝试下面的脚本: from sklearn.f…

### 在scikit的MLPClassifier(和其他分类器)中训练得分低

(更新:发布了最终发现作为单独的答案) 我开始尝试理解…

Pandas即使指定了一些列,也会选择数据框的所有列

我正在尝试使用Scikit-Learn训练KMeans…

Python中多元逻辑回归显示错误

我试图使用逻辑回归进行预测,并使用Python和skl…

按国家列进行分层拆分(对象)

当我尝试按一个分类列进行分层拆分时,返回给我一个错误。…

如何部署我们的机器学习训练模型?

我是机器学习的新手。我已经完成了k-means聚类,模…

我在进行独热编码时,是否必须始终保留一份训练数据的副本?

我正在对分类数据进行独热编码。在测试时,我做了类似这样…

XGBoost产生非二进制预测

在用XGBoost训练我的模型后,我尝试测试模型,但预…

如何在使用校准的交叉验证和线性核的SGD分类器时获取特征权重

我使用校准的交叉验证来对线性核的SGD分类器进行训练,…

KMeans聚类 – 值错误:n_samples=1应该大于等于n_clusters

我在进行一个实验,使用了三个具有不同特征的时间序列数据…