有人能解释一下R语言中pvclust函数的输出吗?

在R语言的pvclust包中,有一个pvclust()函数。在函数帮助文件中提供的示例中,有如下函数:

boston.pp <- pvpick(boston.pv)

这个函数应该会打印出具有高p值的聚类。该函数的输出是:

$clusters$clusters[[1]][1] "rm"   "medv"$clusters[[2]][1] "zn"  "dis"$clusters[[3]][1] "crim"    "indus"   "nox"     "age"     "rad"     "tax"     "ptratio" "lstat"  $edges[1] 3 5 9

我很难理解这个输出的含义,特别是因为我在聚类分析方面的技术背景非常有限。特别是我不理解每个聚类下面的名称向量的含义。有人能为我解释一下吗?谢谢!


回答:

https://cran.r-project.org/web/packages/pvclust/pvclust.pdf描述了pvclust:

对于表示为(n x p)矩阵或数据框的数据,我们假设数据是p个对象的n个观测值,这些对象将被聚类。第i行的向量对应于这些对象的第i个观测值,第j列的向量对应于第j个对象的n个样本

pvpick的输出:

cluster – 一个字符字符串向量的列表。每个向量对应于每个聚类中对象的名称。

你有没有绘制pvclust输出的树状图?pvpick的clusters输出只是列出了一些聚类中的内部点(pvclust将boston数据集中的每一视为一个点),如果你绘制树状图,你会在其中看到这些点。enter image description here

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注