我在学习一门机器学习课程,遇到一个问题无法解决。问题是要使用P(A|B) = P(B|A)*P(A)/P(B)这个公式来计算下面的概率:
回答:
首先,我的语音识别/翻译系统的机器学习知识有点生疏,所以我可能错了。我认为困扰你的可能是它要求计算二元语法概率:P(you|if) = P(if, you) / P(if),这个公式可以从贝叶斯定理中推导出来:
-
P(you|if) = P(if|you) * P(you) / P(if)
- P(if|you) * P(you) = P(if, you)
-
P(if, you) = 1/22(21个二元语法加上最后一个“OK + STOP”的二元语法)
- P(if) = 1/22(假设没有词干提取且不包含符号)
因此:P(you|if) = 1/22 / 1/22 = 1
如果你考虑词干提取,情况会有所变化,因为“your”会变成“you”,而且我也不确定结尾符号’STOP’的处理方式。