我目前正在尝试实现一个机器学习系统,该系统能够查看训练数据集,并根据输入产生一个在0到100之间的实际值输出。
目前我使用的是线性回归模型来确定输出。然而,当考虑其他可能替代回归模型的分类器时,我遇到了瓶颈。基本需求是分类器的输出应为0到100之间的实际值。我尝试过研究神经网络和决策树,但无法理解如何实现这一点。任何帮助都将不胜感激。
数据集
我从数据集中提取了4个不同的特征。所有特征本身都是实际值。我有185个不同的文件,每个文件我都可以提取这4个特征。因此,最终我得到一个185行4列的矩阵。
回答:
使用带有Sigmoid激活函数的人工神经网络(ANN)将输出在(0,1)范围内的值,因此您只需将输出缩放到所需范围(在您的案例中,只需将输出乘以100)。
由于您有4个特征,您将创建一个输入层有4个单元(神经元)且输出层只有一个单元的ANN。您需要决定的是隐藏层的数量以及每个隐藏层中的单元数量。在不了解您的问题性质的更多信息的情况下,我建议从不超过两个隐藏层开始(从一个开始可能更好),并在隐藏层中放置大约6或8个单元。