R FeatureHashing: hashed.model.matrix中的额外值

摘要 为什么由FeatureHashing生成的has…

Bootstrap Sampling on Large Data

我有一个大型数据集,我试图为数据集中的所有实例估计函数…

使用pandas和scikit-learn创建决策树:使用二进制矩阵/出现矩阵

我有一个数据集,它实际上是一些项目特征向量的出现矩阵。…

为什么在线性回归中使用多个特征?

线性回归定义Y是X的函数。使用这个函数可以在X的值发生…

在NLTK(Python)中,语料库和词汇表有什么区别

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

使用Vowpal Wabbit停止机器学习训练但保留模型当前状态

我目前正在使用Vowpal Wabbit进行训练阶段。…

如何使用SVM和逻辑回归的权重向量来确定特征重要性?

我已经在我的数据集上训练了一个SVM和逻辑回归分类器。…

从机器学习中提取参数

我正在尝试使用机器学习来构建图像处理的专家系统 比如说…

无法去除趋势成分和季节性成分

我正在尝试使用ARMA模型来建立一个预测能源生产的模型…

ML足够的特征?

我在尝试用加速度计数据集训练随机森林。我计算了均值、标…

为什么在caret中不同的机器学习方法给出相同的变量重要性?

我在使用caret比较不同的机器学习方法,尽管这些方法…

确定特征评分的阈值 [随机森林]

现在,我正在使用随机森林方法对加速度计、重力和线性加速…

可以使用SVM进行相似性匹配

假设我从两个样本中使用某些方法提取了两个特征向量,我想…

pandas中的loc函数

有人能解释一下为什么在python的pandas中使用…

在scikit-learn中拟合数据与变换数据

在scikit-learn中,所有估计器都有一个fit…

在线应用程序中的权重存储在哪里?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

用户定义的SVM核函数与scikit-learn

我在scikit-learn中自己定义核函数时遇到了问…

SVM用于一对多声学信号分类

我的目标是将一个脉冲音频信号分类为枪声或非枪声。我正在…

vowpalwabbit 奇怪的特征计数

我在训练模型时发现,vw 日志中显示的特征数量非常大(…

机器学习功能用于处理大量数据,通过在多个核心上分配工作

我正在尝试使用R语言在一些大型数据(不是大数据)上运行…

如何在未标记数据集中找到最有希望提供信息的实例以构建分类器?

我的问题是,我有一个大型的未标记数据集,但随着时间的推…

将自定义函数放入Sklearn管道

在我的分类方案中,包括以下几个步骤: SMOTE(合成…

隐马尔可夫模型:状态数量增加是否可能导致准确率下降?

我使用Baum-Welch算法构建了几种隐马尔可夫模型…

基于概念的文本摘要(抽象)

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

在scikit-learn中进行分组抽样

是否有便捷的方法将数据集分割成训练集和测试集,同时保持…