使用聚类分配矩阵为数据分配聚类标签

你好,我正在使用R语言,并且有一个从我的聚类函数中得到的聚类分配矩阵。(我正在对高斯混合数据应用聚类算法)我想创建一个聚类的数据矩阵。以下是我想要做的一个玩具示例。

# 模拟数据
dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
dat
 [1] -0.5350681  1.0444655  2.9229136  8.2528266 -0.7561170 -1.0240702
    -1.0012780 -0.1322981  7.8525855  2.2278264
# 创建一个聚类分配矩阵(实际上这是我的聚类函数的输出)
amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
amat
     [,1] [,2]
[1,]    1    0
[2,]    1    0
[3,]    0    1
[4,]    0    1
[5,]    1    0
[6,]    1    0
[7,]    1    0
[8,]    0    1
[9,]    0    1
[10,]    0    1

我想创建一个名为(比如说)”clust”的数据框或向量,其中包含使用上述分配矩阵分配的聚类标签。基本上,它使用分配矩阵的第一列和第二列,并为来自正态分布N(0,1)的数据分配标签1,为来自正态分布N(2,3)的数据分配标签2。任何帮助都将不胜感激。提前谢谢你。

    # clust应该看起来像这样(我不知道如何使用amat和dat创建它)
    clust
 [1] 1 1 2 2 1 1 1 2 2 2

回答:

该向量已经是二进制的。我们可以对第二列加1L

clust <- amat[,2] + 1L
[1] 1 1 2 2 1 1 1 2 2 2

(后缀L将值强制转换为integer类型)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注