在Google Cloud VM上加速和优化scikit-learn

我在Google Cloud VM上的Ubuntu 1…

sklearn 维度问题 “发现数组维度为3。估计器期望 <= 2"

我试图使用KNN将.wav文件正确分类为两组,组0和组…

KNN – SK learn中knn.score和accuracy度量之间的区别

我关心我的预测与测试的准确性,这是完全合理的。 X_t…

Sklearn模型系数和线性模型中的预测不匹配

我对机器学习和sklearn还比较新手,正在尝试使用具…

BaggingClassifier每次使用整个数据集

from sklearn.ensemble impor…

如何在clf.predict_proba(X_test)中获取更多小数位?

我有一个pandas数据框,用于二元分类情况(类别A和…

如何从多类分类混淆矩阵中提取假阳性和假阴性

我正在使用以下Keras代码对mnist数据进行分类。…

特征聚合:如何找出构成聚类的特征?

我正在使用scikit-learn的特征聚合功能,对特…

为什么GridSearchCV中的best_params_忽略方差?

GridSearchCV中best_param_的文档…

计算固定长度的梯度直方图(HOG),不受图像尺寸影响

我正在训练一个HOG + SVM模型,我的训练数据具有…

Sci-Kit Learn: 将朴素贝叶斯模型预测结果纳入逻辑回归模型?

我有关于各种客户属性的数据(自我描述和年龄),以及这些…

sklearn的DecisionTreeClassifier真的能处理分类数据吗?

在使用DecisionTreeClassifier时,…

ValueError: 输入包含NaN、无穷大或对于dtype(‘float64’)来说过大的值,而这是在预处理数据时发生的

我有两个CSV文件(训练集 和 测试集)。由于在一些列…

在整个数据集上计算TF-IDF还是仅在训练数据上计算?

在《TensorFlow机器学习食谱》一书的第七章中,…

如何处理在预测时测试数据经过独热编码后的类别不匹配问题?

如果问题的标题不够清晰,我深感抱歉,我无法在一行内总结…

使用带有predict_proba方法的SGDClassifier

我正在使用sklearn库来训练和测试我的数据。 ta…

TF-IDF提取关键词

正在处理类似于下面的函数: def get_featu…

在scikit-learn中使用GridSearchCV选择前k个最佳模型

在scikit-learn中进行网格搜索后,是否有简单…

使用Scikit-learn处理数字数据集

我不明白 我在尝试使用Scikit-learn和Mat…

在执行分层时,是否应保持类别比例?

我有30,000个按情感分类的短语。 我打算使用朴素贝…

从递归特征消除(RFE)中提取最优特征

我有一个包含分类和数值数据的数据集,共有124个特征。…

决策树的唯一性 sklearn

我对于决策树和随机森林分类器有一些问题。 问题1:训练…

scikit-learn的DecisionTreeClassifier.tree_.value有什么作用?

我正在研究一个DecisionTreeClassifi…

spark_sklearn GridSearchCV __init__ 初始化参数错误

我在尝试使用spark_sklearn.GridSea…

如何通过梯度下降的反向传播表示每次前向传播后的误差

在神经网络多层感知器中,我理解随机梯度下降(SGD)和…