寻找k聚类的另一个比肘部法更有用的方法

我在尝试为机器学习中的k-means方法找到合适的k聚…

这篇论文中提到的“哈希树”具体是哪种类型?

我在实现一篇论文中的算法,其中部分需要使用“哈希树”。…

为什么我的关联模型在数据集中发现了不应该存在的子群体?

我提供了很多关于我编写代码所使用的方法的信息。如果你只…

如何正确地对文本分类器进行tfidf变换和“拟合”值?

我正在编写一个朴素贝叶斯分类器,因为我有一大组文本文档…

基于字符串属性的用户相似性查找

我是一名软件工程专业的学生,对数据挖掘领域还不太熟悉,…

确定聚类效果

在聚类中,噪声、冗余和无关属性对其有何影响?它们最终是…

从文本到K-Means向量输入

我刚刚开始深入学习机器学习,特别是聚类分析。(我使用的…

k-means算法中k与质心的区别

我在K-means聚类算法中有些困惑。算法的初始步骤是…

单字模型何时比双字模型(或更高阶的N字模型)更合适?

我在阅读关于N字模型的内容时,想知道在实践中是否有使用…

在do_one(nmeth)函数中出现错误:外函数调用中的NA/NaN/Inf(参数1)

已关闭。 此问题需要调试细节。目前不接受回答。 编辑问…

逐步查看K-Means迭代的程序?

我在使用R语言进行K-Means聚类分析,但无法获取最…

决策树产生不同的输出

我目前正在使用决策树(使用Scikit Learn)来…

ELKI 层次聚类 – “mrg_” 聚类对象

我正在使用 ELKI’s SimplifiedHier…

数据挖掘和机器学习领域哪个编程语言的社区最好?Python,Java,C++还是其他?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

处理不平衡数据的分箱

我有一个看起来像这样的不平衡的数值数据集: 我需要将数…

什么是分层自助法?

我已经学习了自助法和分层方法。但是什么是分层自助法?它…

DBSCAN用于按位置和密度聚类数据

我正在使用dbscan::dbscan方法来按位置和密…

如何推导出聚类属性

我已经将大约40000个点聚类成了79个簇。每个点都是…

单链接层次聚类方法切割树

我有一个包含3个类别{c1, c2和c3}的数据集。我…

ELKI OPTICS预计算距离矩阵

我似乎无法让这个算法在我的数据集上工作,所以我从我的数…

最接近的核心样本 DBSCAN 在 scikit

我想为每个数据点找到最接近的核心样本。这样我就可以仅用…

WARMR (ACE套件):从频繁模式中消除“连接”的术语

我在ACE数据挖掘套件中使用WARMR频繁模式算法。这…

评估朴素贝叶斯分类器通过构建混淆矩阵

我正在尝试为血压患者构建一个混淆矩阵,实际预测的患者中…

稀疏高斯过程回归的初始种子

我使用了Rasmussen提出的稀疏高斯过程进行回归。…

社区检测:是否有将一个人分配到多个社区的算法?

我觉得在某些情况下,将一个人分配到多个社区是合理的。例…