在机器学习中,假设我们有一个用于分类的GDA(高斯判别分析)模型。
如果y可以取值0或1,且x代表具有n个特征的向量(n x 1维度)
对于一个特定的训练样本,p(x| y=0)或p(x|y=1)表示什么?x实际上是一个向量..条件概率是如何定义的?任何帮助将不胜感激。
回答:
假设X0是映射到输出0的向量x的集合,而X1是映射到输出1的向量x的集合。计算每个集合中向量的均值,并以类似的方式,估计协方差。然后,构建两个多元正态分布,分别使用这些均值和协方差。
一旦你有了这些分布,只需将你想要的向量代入PDF中,就可以得到其密度。请注意,由于概率是连续的,你所询问的概率通常为0。