计算BIC的公式如下,
BIC = -log(data/theta) - (# of parameter / 2) * log(n).
假设情况如下:
二维高斯数据,样本数量number of samples(n) = 500
,聚类数量number of clusters(K) = 4
。
这里的# of parameters
是多少?
我认为最简单的逻辑是# of parameters = K * 3 = 12. k * 3
,因为每个k = 4
类别有三个参数(mu
,sigma
和prior
)。
如果我错了,请纠正我。
回答:
如果你的数据维度是d
,你的均值向量可能有d
个变量,你的协方差矩阵有d^2
个变量。
所以我认为你有(2 + 2 * 2 + 1) * 4 = 28
个变量。