单一正非限制输出值的神经网络

有人能帮我选择合适的神经网络激活函数吗?我用Python编写了这个网络,它应该根据房产的特征(输入)来估算房价(输出)。

目前,我在输出层和隐藏层都使用了Sigmoid激活函数。在所有训练案例中,价格都被标准化了(item.price / max_price_of_all_items),所以在输出上我得到的值小于1。以下是我使用的一些其他特征:

  • 学习速度为0.01
  • 训练集包含大约600个条目(最多可达3500个)
  • 隐藏层2层
  • 每层神经元5个
  • 输入9个
  • 输出1个
  • 训练轮次5000次(是否不够?)

训练后的网络结果非常差。是否有我遗漏的地方?是否有可能在输出上得到正常的价格(而不是现在这样的[0:1)范围内的值)?我是否应该更改输出神经元的激活函数?

感谢任何帮助


回答:

以下是一些建议:

  1. 确保你在输出上使用均方误差,不需要激活函数:err(x,f(x))= (x-f(x))^2,其中x是真实输出,f(x)是预测输出。

  2. 如果你自己实现了反向传播,跟踪网络在每个训练轮次的平均误差。如果误差在轮次之间增加,这表明你的实现有误。你还可以通过使用有限差分计算的近似梯度来检查反向传播计算的梯度。

  3. 标准化你的输入和输出:减去均值并除以标准差,或者使用PCA白化你的数据

资源:

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注