这可能看起来是个愚蠢的问题。
我正在通过一些网球数据运行一个神经网络。网络的目标是确定每位选手赢得比赛的概率。网络有大约40个输入,一个输出(即选手A获胜的概率,选手B的概率为1减去输出值)。
输入是每位选手在过去n场比赛中的各种统计数据和表现指标。我已经编写了从我的网球比赛结果数据库中提取这些数据的代码,这些数据随后被输入到神经网络中。
我遇到的问题如下:
在训练集中,与被网络分析的比赛的获胜者相关联的输入值,总是通过相同的输入神经元输入。因为这样,期望的输出总是1,因为选手A总是赢(这是我的数据库的结构,选手A是比赛的赢家,选手B是输家)。
我该如何克服这个问题?是否只是简单地随机化选手A和选手B的顺序?
希望这个问题有意义。
非常感谢
回答:
我会训练每场比赛两次,一次以获胜者-输家的输入和输出’1’,一次以输家-获胜者的输入和期望输出’0’。
(哦,我不认为神经网络的输出可以被解释为概率,意思是如果ANN预测某个结果的输出是0.9,它会在10次中有9次正确。)