我在使用亚马逊网络服务的机器学习服务进行一个试点项目时,有一些疑问。
我使用了一个二元分类模型,依我看,得到的结果直方图与数值结果不符。根据直方图,假阳性的分布高于真阴性的分布,但数值结果并未显示这种情况。
- 778个真阳性
- 15,178个真阴性
- 6,663个假阳性
- 173个假阴性
有谁能对此提供一些见解吗?
谢谢,
回答:
这是我在亚马逊网络服务支持团队论坛上得到的回答:
经过一番调查,我发现直方图的Y轴使用的是对数刻度,这解释了为什么直接对真阴性和假阳性进行1:1的面积比较与数值结果不一致。如果我们不使用对数刻度,我猜测你的Y轴大部分将会被真阴性和真阳性结果所占据,而假阳性和假阴性可能太小而难以察觉。
参考:https://forums.aws.amazon.com/message.jspa?messageID=733706
如果Y轴是 logarithmically,那么结果确实与提供的直方图相符。