用于填补稀疏矩阵数据的机器学习算法

我在此处看到了一些关于机器学习的问题,因此我想发布一个…

如何识别球树中所有包含点都在一个聚类中的内部节点?

我正在阅读《数据挖掘:实用机器学习工具与技术第三版》这…

现有研究中是否有能够区分不同人声音的语音识别技术?

已关闭。 此问题不符合主题。目前不接受回答。 想要改进…

将Weka模型保存为文本

我想将我的Weka分类器模型保存到一个文件中,以便其他…

混合(二元与数值)向量的相似度得分

我有一个数据集,其中每个样本大约有200个特征,其中大…

验证聚类算法的输出

是否有客观的方法来验证聚类算法的输出? 我正在使用sc…

数据挖掘MPI库

有没有使用MPI(消息传递接口)的数据挖掘库,或者可以…

用于练习线性回归或逻辑回归的工具或框架

我正在寻找一个工具框架,可以让我实现线性回归和逻辑回归…

我正在寻找一种算法或函数,能够将文本字符串转换为数字

我正在寻找一种算法、函数或技术,能够将字符串转换为数字…

如何正确评估机器学习模型是否过拟合?

我理解过拟合和欠拟合的直观含义。现在,假设有一个在训练…

你可以为逻辑回归定义自己的成本函数吗?

在最小二乘模型中,成本函数被定义为预测值与实际值之间差…

如何计算线性回归中的正则化参数

当我们使用高次线性多项式来拟合一组点时,为了防止过拟合…

适用于Hadoop的入门项目

我将在明年春天毕业。为了在明年的就业市场上具备竞争力,…

在LibSVM中特征值的缩放是否必要?

如果我有200个特征,并且每个特征的值可以从0到无穷大…

梯度下降与牛顿梯度下降的区别是什么?

我了解梯度下降的作用。基本原理是通过沿着曲线缓慢移动来…

应该选择多少主成分?

我知道主成分分析是对矩阵进行奇异值分解,然后生成一个特…

在Weka中类属性的名义值排序

在创建训练集时,我输入了“true”和“false”,…

WEKA LibSVM 成本的权重参数

我正在使用 LibSVM 在一个高度不平衡的数据集上训…

如何测试一个核函数是否为有效核函数

如果我定义了一种方法来确定我的支持向量机分类器中两个输…

期望最大化技术的直观解释是什么?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何处理WEKA中的名义属性与数值属性?

如果我的数据集中某一列只有三个可能的值,即0、1和2,…

kmeans是否需要三角不等式?

我想知道kmeans中使用的距离度量是否需要三角不等式…

在sklearn中持久化数据

我正在使用scikit-learn来对文本文档进行聚类…

数据挖掘和基于文本的模式识别

我正在开发一款软件,用于提取用户在Twitter个人资…

在MATLAB中对单元数组进行分类

我想对一组新闻数据集进行文本分类。我有很多特征,比如s…