这是我的数据(简化版):
Athletics Age Competition Result(m)--------------------------------------------Alex 10.2 CompA 3.2Alex 11.5 CompB 4.3...Bob 9.9 CompC 3.5Bob 10.7 CompD 5.6...Dave 10.3 CompB 5.2Dave 11.6 CompD 6.3....
我的数据是关于一组不同年龄(8-28岁)的儿童在不同比赛中的跳远成绩。
我想知道的是:
- 如果我们知道一个新孩子Paul的历史数据(例如从8岁到16岁),如何预测他未来的成绩(比如18岁、20岁、24岁)?
- 如果我们能根据最佳成绩将跳远者分成A-E组,如何预测Paul未来会属于哪个组(比如他18岁时)?
我最近学习了一些机器学习和深度学习的知识,我知道这个问题可以用这些模型来解决,但我不知道应该使用哪些模型。
- 我应该仅根据Paul的历史数据来预测Paul的成绩吗?还是应该使用其他人的数据,比如Alex、Bob、Dave的数据?
- 这是时间序列预测问题吗?我应该使用像ARIMA、ARCH、LSTM(RNN)这样的模型吗?
- 还是这是一个“普通”的监督或非监督回归或分类问题?我应该使用像线性回归、逻辑回归、KNN、NB、DT、SVM、随机森林、ANN、DNN、CNN这样的教科书模型吗?
任何指导都将不胜感激。
回答:
答案是两者皆有。回归只是意味着模型输出层没有使用sigmoid激活函数。因此,你可以使用像LSTM或GRU这样的时间序列模型(使用如此复杂的模型可能会导致过拟合),然后用它们来进行回归。这样,模型将学习其他儿童的表现方式,然后使用Paul的数据来预测他未来的表现。这不是一个分类问题!你是在预测连续值,而不是类别。这意味着它必须是回归。
我建议阅读书籍或参加教程,我喜欢《用Python进行深度学习》这本书。