数据子集的分层拆分

我有一个总数据集,规模为10,000。我知道我可以使用…

如何提高决策树回归器中的负R平方

我在尝试应用一些回归器来预测IMDB评分。这是我的尝试…

使用cross_val_predict和cross_val_score时的scikit-learn分数不同

我期望这两种方法返回的误差应该是相当相似的,有人能指出…

SVM 二元性:不支持的超参数集

我正在尝试在 Iris 数据集上训练一个 SVM 模型…

SVM方法能否处理一维数据进行预测?

我正在尝试使用SVM来预测某一特定一维数据的未来值。该…

如何从GridSearchCV输出中可视化XGBoost树?

我使用XGBRegressor通过gridsearch…

如何使用Tf-idf特征来训练你的模型?

from sklearn.feature_extrac…

有人能解释一下MinMaxScaler()是如何工作的吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何仅执行scikit-learn管道的特定部分?

以下是与问题相关的一部分代码。如果需要完整代码,这里有…

CountVectorizer 适应时间过长

def tokenize(text): text = …

ValueError: 预期接收可迭代的原始文本文档,但接收到字符串对象。使用tfidf和选择特征预测新测试数据

我已经使用sklearn的朴素贝叶斯分类器构建了一个模…

如何在训练、验证和测试样本中选择几乎均匀分布的类别?

我正在使用MNIST Sign Language数据集…

构建用于词级文本分类的n-gram

我正在尝试使用scikit-learn对多类数据进行词…

使用带有分类输出的逻辑回归 sklearn

我需要使用sklearn的逻辑回归来训练一个模型。我看…

不同特征的不同内核 – scikit-learn SVM

我正在尝试使用 sklearn.svm.SVC 构建一…

在Python中进行文本分类的过采样?

我有一个文本数据框架需要进行分类。但我首先需要进行过采…

在进行SVM时,传递了一个列向量y而期望的是一维数组错误?

我正在创建一个具有一个自变量X和因变量y的SVM模型。…

使用SciKit-Learn中的Pipeline进行排列重要性分析

我使用了来自SciKit的精确示例,该示例将permu…

使用Sklearn的train_test_split()返回值进行变量赋值

我在使用sklearn中的train_test_spl…

使用新数据更新LGBM模型

我想用额外的数据来“更新”一个已经训练好的轻量梯度提升…

### 用于预测文本数据的Pipeline API – ‘AttributeError:

我的用于文本数据预测的Pipeline模型是 pipe…

忽略训练数据中不存在的测试特征

我有一个任务,需要使用sklearn创建三个分类器(两…

调整numpy数组大小以使用sklearn的train_test_split函数?

我正在尝试使用sklearn中的test_train_…

如何告诉SciKit的LinearRegression模型预测值不能小于零?

我有以下代码,尝试根据非价格基础特征来估值股票。 pr…

在哪里设置n_jobs:在估计器中还是在GridSearchCV中?

我经常使用GridSearchCV进行超参数调优。例如…