线性回归预测路线难度效果不佳

我试图预测一条路线的难度。一条路线由一系列点组成，每个点相隔10米。每个点具有以下信息：

路径宽度
森林密度
坠落速度（如果坠落，你的身体会达到什么速度）
坡度

每条路线也有一个给定的难度。但是这些难度是由不同的人给出的，并且差异很大。所以有一个人给了一条路线4分，但另一个人可能给这条路线打了2分。因此，数据中包含人为错误。

我目前所做的：
我计算了每条路线的平均值和标准差。所以我使用了一条路线的所有点来计算这些统计值。我还添加了路线的长度（点数乘以10）。（diff = 路线的难度。值从1到12）

然后我将这些值放入线性回归模型中。这证明是一个很好的开始：

Mean Absolute Error: 1.239902061226418Mean Squared Error: 2.3566221702532917Root Mean Squared Error: 1.53512936596669

问题

但现在我不知道该做些什么来改进它，因为我缺乏机器学习的知识。

我有了一个使用神经网络的想法，只需将所有点输入进去。最长的路线有5300个点长，所以我会说，每条路线有5300个输入，并为那些不够长的路线用0值填充点。有没有关于这方面的信息或输入？

但我也希望通过使用上述显示的预测值（平均值、标准差等）来获得好的结果。那么我能做些什么来改进预测呢？

回答：

以下是你需要遵循的一些步骤，以开发最佳模型：

学技术