如何在数值型、单选题和多选题之间寻找相关性?

我有一个包含数值型、单选题和多选题的问卷数据集。总共有…

特征分类数据中每个特征编码多个值的一热编码

我对scikitlearn还比较陌生,目前正在处理预处…

使用Scikit-learn对包含混合数据的数据集进行K-means聚类

我正在尝试机器学习算法,并且有一个包含数值和分类数据的…

如何处理训练数据中未包含所有预期类别的分类数据?

我的数据中有一个名为“级别”的特征,数据可能包含的级别…

sklearn的DecisionTreeClassifier真的能处理分类数据吗?

在使用DecisionTreeClassifier时,…

分类特征相关性

我的数据中包含了一些分类特征和连续特征。将分类特征进行…

机器学习:处理大量分类数据的最佳技术

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

KNN分类中的字符串数据训练:Python

我一直在尝试学习如何训练我的数据,即实现包含字符串数据…

如何为训练集和测试集获取虚拟变量?

我想为训练集和测试集的分类字段创建虚拟变量,然后仅在训…

1-of-k编码 Apache Spark 在 Java 中

我在尝试测试我在Spark文档中找到的代码,以便在Ap…

如何在R中为分类变量创建部分依赖图?

我正在使用r包randomForest,已经成功创建了…

scikit learn 离散化分类数值数据

我在尝试将数据离散化以用于分类。它们原本是字符串,我已…

将OneHotEncoded特征输入分类器时出现错误

我正在尝试为决策树和多项式朴素贝叶斯分类器准备数据。 …

使用mRMRe进行分类目标变量的特征选择

我正在尝试使用R语言中的mRMRe包对基因表达数据集进…

在实时系统中使用sklearn的DictVectorizer

任何二进制的一热编码都只能识别训练过程中见过的值,因此…

如何可视化回归输出与分类输入变量的关系?

已关闭。 此问题不符合 Stack Overflow …

回归分析中分类特征和顺序特征数据的区别?

我正在试图完全理解在进行回归分析时分类数据和顺序数据之…

回归分析中的分类和顺序特征数据表示?

我在尝试全面理解回归分析中分类数据和顺序数据的区别。目…

处理回归(机器学习)中分类特征的未分配(空值)值?

我想进行线性回归分析。我有多个特征。某些特征在数据中的…

如何区分回归分析中的分类变量和顺序变量?

我在进行关于房屋数据的线性回归分析,目前有23个特征。…

如何将30个类别转换为数字以用于Scikit

我对统计学、Python、机器学习和Scikit-le…

删除训练数据中不存在的新因子水平

我在调试使用随机森林包的代码,几乎没有之前的R语言经验…

在GBM多项式分布中,如何使用predict函数获取分类输出? [duplicate]

这个问题已有答案: GBM多项式分布,如何使用pred…

使用分类列作为条件对薪资数据进行特征工程

需要根据分类列将薪资金额转换为年薪: ‘M…