你好,我正在使用R语言,并且有一个从我的聚类函数中得到的聚类分配矩阵。(我正在对高斯混合数据应用聚类算法)我想创建一个聚类的数据矩阵。以下是我想要做的一个玩具示例。
# 模拟数据
dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
dat
[1] -0.5350681 1.0444655 2.9229136 8.2528266 -0.7561170 -1.0240702
-1.0012780 -0.1322981 7.8525855 2.2278264
# 创建一个聚类分配矩阵(实际上这是我的聚类函数的输出)
amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
amat
[,1] [,2]
[1,] 1 0
[2,] 1 0
[3,] 0 1
[4,] 0 1
[5,] 1 0
[6,] 1 0
[7,] 1 0
[8,] 0 1
[9,] 0 1
[10,] 0 1
我想创建一个名为(比如说)”clust”的数据框或向量,其中包含使用上述分配矩阵分配的聚类标签。基本上,它使用分配矩阵的第一列和第二列,并为来自正态分布N(0,1)的数据分配标签1,为来自正态分布N(2,3)的数据分配标签2。任何帮助都将不胜感激。提前谢谢你。
# clust应该看起来像这样(我不知道如何使用amat和dat创建它)
clust
[1] 1 1 2 2 1 1 1 2 2 2
回答:
该向量已经是二进制的。我们可以对第二列加1L
:
clust <- amat[,2] + 1L
[1] 1 1 2 2 1 1 1 2 2 2
(后缀L
将值强制转换为integer
类型)