使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

分层拆分pandas数据框到训练、验证和测试集

以下是一个极度简化的DataFrame,代表包含医疗诊…

使用交叉验证评分获得零分

我在尝试对数据集使用cross_val_score,但…

Naivebayes MultinomialNB scikit-learn/sklearn

我正在构建一个朴素贝叶斯分类器,并按照scikit-l…

累积计数并在满足条件时重置为0

目前我有一个数据集,我试图在ColA为0时累积值,而当…

使用关键词对列中的文本进行分类

我有一个表格列,包含了解决问题的处理描述,这些文本中包…

rank hot encoding python3

我想使用rank-hot编码而不是one-hot编码来…

sklearn 特征不影响准确率

我最近开始使用 sklearn 进行机器学习。在使用一…

Pandas: 在不使用循环的情况下获取数据子集

我想根据customer_id(数据框中的多行可能有相…

基于字符串匹配打印列表的二维矩阵

我有一个列表,我想根据每个选定的特征将其以网格形式表达…

比较Pandas数据框的列名

如何比较两个不同Pandas数据框的列名?我想比较训练…

将pandas的describe()函数结果重塑为一行,并带有列名

我在为机器学习算法生成一些特征,并希望从数据框中计算一…

如何检查数据框中各行之间的相似性并添加一个计数器列,在行匹配时递增?

我对Python(Pandas)还不是很熟悉,请帮助我…

分类和绘制的数据点数量与数据集中的点数不匹配

我正在使用一个包含54个数据点的Python数据集,通…

多变量KNN预测

所以,我有一段代码,如果我有一维特征的数据来预测下一个…

pandas describe() 不显示

我正在按照谷歌的机器学习课程学习,并尝试在Atom上运…

如何仅对数据框中的分类数据进行编码

输入图片描述 如何仅对数据框中的分类数据进行编码 In…

计算 np.mean 预测值并应用百分比过滤器

我需要计算 clf.predict 的 np.mean…

特征哈希是如何工作的?

我阅读了许多关于机器学习中分类变量特征哈希的在线文章。…

纬度和经度在欺诈检测分类机器学习中的转换

我正在尝试构建一个用于账户注册时欺诈检测的机器学习分类…

查找最相关的三个类别及其相应的概率

从下面的脚本中,我找到了多类文本分类问题中最高的概率及…

字符串模式的总和?

我有一个像这样的Pandas DataFrame: I…

SKlearn 对 X 和 Y 的 reshape 警告

我刚开始学习机器学习,正在使用 Python(3.6)…

在随机森林分类器中遇到未拟合错误?

我有4个特征和一个目标变量。我使用RandomFore…

Pandas DataFrame条件返回TypeError: ‘>’ not supported between instances of ‘str’ and ‘int’

我在使用pandas处理一个DataFrame,并需要…