我想计算二维数据的高斯概率密度函数(PDF),我尝试在Python中使用scipy.stats.multivariate_normal
函数来实现,但我不明白如何将我的数据传递给它?
multivariate_normal
函数是否仅用于分析一维数据的n维情况,还是也可以用于我的数据集?
数据集-> X = [X1,X2....Xn]
其中每个
Xi=[x1 x2]
都是二维的。
回答:
要计算密度函数,请使用对象scipy.stats.multivariate_normal
的pdf()
方法。第一个参数是你的数组X
。接下来的两个参数是分布的均值和协方差矩阵。
例如:
In [72]: import numpy as npIn [73]: from scipy.stats import multivariate_normalIn [74]: mean = np.array([0, 1])In [75]: cov = np.array([[2, -0.5], [-0.5, 4]])In [76]: x = np.array([[0, 1], [1, 1], [0.5, 0.25], [1, 2], [-1, 0]])In [77]: xOut[77]: array([[ 0. , 1. ], [ 1. , 1. ], [ 0.5 , 0.25], [ 1. , 2. ], [-1. , 0. ]])In [78]: p = multivariate_normal.pdf(x, mean, cov)In [79]: pOut[79]: array([ 0.05717014, 0.04416653, 0.05106649, 0.03639454, 0.03639454])