理解K-means聚类中的一些术语

我需要编写一个程序来实现给定数据集的kmeans聚类(…

聚类+回归——这是正确的方法吗?

我的任务是预测商品的销售速度(例如,在某一类别中)。例…

如何分析三个机器学习模型的输出以获得一个最终结果?

我正在尝试对歌曲进行基于流派的分类。 我已经提取了歌曲…

使用Orange提取关联规则时遇到的问题?

我的数据集尺寸为(878049, 6)。 数据集看起来…

寻找k聚类的另一个比肘部法更有用的方法

我在尝试为机器学习中的k-means方法找到合适的k聚…

这篇论文中提到的“哈希树”具体是哪种类型?

我在实现一篇论文中的算法,其中部分需要使用“哈希树”。…

为什么我的关联模型在数据集中发现了不应该存在的子群体?

我提供了很多关于我编写代码所使用的方法的信息。如果你只…

如何正确地对文本分类器进行tfidf变换和“拟合”值?

我正在编写一个朴素贝叶斯分类器,因为我有一大组文本文档…

基于字符串属性的用户相似性查找

我是一名软件工程专业的学生,对数据挖掘领域还不太熟悉,…

确定聚类效果

在聚类中,噪声、冗余和无关属性对其有何影响?它们最终是…

从文本到K-Means向量输入

我刚刚开始深入学习机器学习,特别是聚类分析。(我使用的…

k-means算法中k与质心的区别

我在K-means聚类算法中有些困惑。算法的初始步骤是…

单字模型何时比双字模型(或更高阶的N字模型)更合适?

我在阅读关于N字模型的内容时,想知道在实践中是否有使用…

在do_one(nmeth)函数中出现错误:外函数调用中的NA/NaN/Inf(参数1)

已关闭。 此问题需要调试细节。目前不接受回答。 编辑问…

逐步查看K-Means迭代的程序?

我在使用R语言进行K-Means聚类分析,但无法获取最…

决策树产生不同的输出

我目前正在使用决策树(使用Scikit Learn)来…

ELKI 层次聚类 – “mrg_” 聚类对象

我正在使用 ELKI’s SimplifiedHier…

数据挖掘和机器学习领域哪个编程语言的社区最好?Python,Java,C++还是其他?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

处理不平衡数据的分箱

我有一个看起来像这样的不平衡的数值数据集: 我需要将数…

什么是分层自助法?

我已经学习了自助法和分层方法。但是什么是分层自助法?它…

DBSCAN用于按位置和密度聚类数据

我正在使用dbscan::dbscan方法来按位置和密…

如何推导出聚类属性

我已经将大约40000个点聚类成了79个簇。每个点都是…

单链接层次聚类方法切割树

我有一个包含3个类别{c1, c2和c3}的数据集。我…

ELKI OPTICS预计算距离矩阵

我似乎无法让这个算法在我的数据集上工作,所以我从我的数…

最接近的核心样本 DBSCAN 在 scikit

我想为每个数据点找到最接近的核心样本。这样我就可以仅用…