我正在尝试构建一个神经网络来帮助预测NBA球员在整个赛季的幻想生产总分。我已经对球员职业生涯的每个赛季使用了一组特定的统计数据来计算那个赛季的总生产分数。我希望构建某种回归模型,能够预测球员未来三年的生产分数。
示例输入,其中每个数组是一个球员职业生涯的生产数字:
[22.3, 44, 33.1],[10, 16.2, 42, 67, 54.3, 68.9, 62, 43, 12],[45, 79, 58, 54, 42],[12, 24],[33, 67, 72, 80.3, 94.6, 74]
我看到的大多数神经网络都期望输入的特征数量相同,但在这种情况下,每个球员的输入数量会根据他们所打的赛季数量而不同。我看到有人建议将缺失的数据值置零,但我不想这样做,因为神经网络会开始期望在几个赛季后生产会有巨大的下降,而且零在生产分数方面是一个有意义的值。
是否有神经网络可以处理每个球员不同长度的输入?它会使用球员的职业生涯长度来帮助预测球员未来的生产分数吗?
回答:
这正是循环神经网络被设计来解决的问题!循环神经网络接受序列输入,并且只有一个节点在序列的每个时间步上被共享/重复。它可以处理不同大小的输入,但请注意,如果你不愿意对输入进行零填充,你将不得不一次处理一个输入。无法对锯齿形输入矩阵进行向量化。如果你的数据量不是很大,这不会是一个大问题。点击这里获取更多信息。