我试图使用混淆矩阵解决一个相当基础的问题,但我的解决方案与正确答案不符。
问题:假设我们有一个药物测试,可以准确识别99%的药物使用者,并且对99%的非使用者有准确的阴性结果。但整体使用者中只有0.3%的人使用这种药物。
如果某人测试结果为阳性,那么他实际使用药物的几率是多少?
另外,TP / (TP + FN)
是否与P(A) P(B|A)/P(B)
相同?
我的方法:
TP TN TotalUsers 预测为阳性 29.7 0.3 30非使用者 预测为阴性 99.7 9870.3 9970 129.4 9870.6 10000
根据以上数据,我得到:29.7/129.4 = 0.2295208655,大约是22.95%
但答案显示:22.8%。我很困惑。正确的做法是什么?
回答:
我明白了:
给出的方法大致是这样的 – P(B)是1.3%(0.99*0.003 + 0.01*0.997),所以,P(B|A) = P(A) P(B|A) / P(B) = 0.003*0.99 / 0.013 = 0.228。所以是’22.8%’
但他们将数字四舍五入到1.3%而不是1.294%,这就是为什么值不同!!