Keras CNN 参数过少

我正在尝试在Keras中重现以下教程中的CNN,该CNN具有3个输入和Sigmoid激活函数:

enter image description here

所以参数数量应该是7(假设有一个大小为2的滤波器,在2个位置上卷积(要么是上两个输入,要么是下两个输入),有2个共享权重(在突触上显示为1.0),并且在conv1d层中没有填充)。当我在Keras中编写以下代码时:

enter image description here

当我在model.summary()中检查时,我只得到了5个参数:

enter image description here

我需要做些什么才能得到正确数量的参数?由于我刚开始使用Keras,我的代码中可能有几个错误的地方。


回答:

所有卷积参数在空间上是共享的(在1D情况下,这意味着在输入序列上共享)。具体来说,长度为2的卷积滤波器会应用两次到输入(x[0], x[1])(x[1], x[2]),但这两种情况使用的是同一个滤波器,对应的可训练参数也是相同的。

这解释了你现在得到的模型大小:Conv1D有3个参数(权重(2)和偏置(1)),密集层有2个参数,因为Conv1D的输出是(?, 2, 1)

最后,我无法评论你试图实现的网络。可能他们指的是2个滤波器(但那样的话,层将会有6个参数)…但我不知道有任何实现中卷积层对每个补丁有单独参数的情况。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注