从双变量高斯分布生成均值

我在阅读《统计学习的要素》ESLII,在第2章中,他们使用了一个高斯混合数据集来演示一些学习算法。为了生成这个数据集,他们首先从一个双变量高斯分布N((1,0)’, I)中生成10个均值。我不太明白他们是什么意思?

如何从均值为(1,0)的双变量分布中生成10个均值?


回答:

从双变量高斯分布中生成的每个均值只是简单地从该分布中采样得到的单个点,与从该分布中可能生成的其他随机点的方式完全相同。它们使用这些生成的点作为新分布的均值这一事实并不重要。

假设这10个均值中的每一个都用来构建一个新的双变量高斯分布。

means ~ N( (1,0), I)

其中~表示从分布中抽取的值。由于在这种情况下采样的分布是双变量高斯分布,因此每个采样的数据点将是一个二维点(x1, y1)。

从原始分布中采样的这些点随后可以用来创建新的分布。

示例:

means = [ (x1,y1), (x2,y2), ..., (x10,y10) ]

构建新的双变量高斯分布:

N1((x1,x2), I), N2((x2,y2), I), ..., N10((x10,y10), I)

他们只是使用初始的双变量高斯分布N((1,0), I)作为一种简单的方法来选择10个正常分布的随机均值。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注