我的单层感知器不工作

这是代码。

public class Adaline{    private int _layer;    public int Layer { get { return _layer; } }    private int _epoch;    public int Epoch { get { return _epoch; } }    private double _error;    public double Error { get { return _error; } }    private double[] _weights;    public Adaline(int layer)    {        _layer = layer;        _weights = new double[layer];        Reset();    }    public void Reset()    {        Random r = new Random();        for (int i = 0; i < _layer; i++)            _weights[i] = r.NextDouble() - 0.5;        _error = 1;    }    public void Train(BasicTrainSet<double> trainset, double learnRate)    {        double ers = 0;        for(int p = 0; p < trainset.DataCount; p++)        {            double result = Compute(trainset.Input[p], true);            double error = trainset.Output[p] - result;            for (int i = 0; i < _weights.Length; i++)            {                _weights[i] += error * trainset.Input[p][i] * learnRate;            }            ers += Math.Abs(error);        }        _epoch++;        _error = ers;    }    public double Compute(double[] input, bool quan)    {        double result = 0;        for (int i = 0; i < _layer; i++)            result += Math.Tanh(_weights[i] * input[i]);        //double result = _weights.Zip(input, (a, b) => Math.Tanh(a * b)).Sum();        return quan ? (result >= 0 ? 1 : 0) : result;    }}

当我尝试训练AND门时,表现如下。上面的四个结果来自此代码这很奇怪,因为算法本身没有问题。权重越来越大。我哪里出错了?


回答:

在你的代码中,计算每个神经元输出的方式不对。你需要先计算权重和输入的点积,然后再应用激活函数。你现在是在每次加权累加后就应用激活函数,这是不正确的。

应该先累加,再应用激活函数:

public double Compute(double[] input, bool quan){    double result = 0;    for (int i = 0; i < _layer; i++)        result += _weights[i] * input[i]; // 修改 - 先累加    result = Math.Tanh(result); // 修改 - 现在应用激活函数    return quan ? (result >= 0 ? 1 : 0) : result;}

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注