我尝试使用Keras进行信用卡欺诈预测。为此,我有一个包含超过280,000个不同案例的信用卡数据文件,每个案例都被标记为欺诈或有效。
我的问题是,我的代码实际上可以编译,但在第一个epoch,我的准确率就已经达到了0.9979,从第二个epoch开始,准确率为0.9982。
这对我来说似乎不太现实,但我不知道我的错误出在哪里。
这是我代码的简化版本:
非常感谢任何帮助!
回答:
你的测试数据是否平衡?
因为如果不是,例如,它是一组真实数据,我猜一个简单的模型,无论输入什么都回答“有效”,很容易就能获得超过99%的准确率。尝试报告F1分数,这是(不平衡)检测任务的默认选择。