我是机器学习的新手,我在处理一个模型时遇到了困难。
为了尝试找出大模型的问题,我想要创建一个简单的模型,其目标只是输出输入值的两倍,但即使是这个简单的问题,我也未能成功,因为模型虽然编译了,但无法学习。
能有人帮帮我吗?我很沮丧,因为我完全不知道为什么这个简单的模型无法学习。
回答:
这是因为你使用了ReLU激活函数,这导致参数的导数为0。使用线性激活函数可以解决这个问题。它能很好地拟合:)
你也可以尝试以某种方式改变参数的初始化器。
我是机器学习的新手,我在处理一个模型时遇到了困难。
为了尝试找出大模型的问题,我想要创建一个简单的模型,其目标只是输出输入值的两倍,但即使是这个简单的问题,我也未能成功,因为模型虽然编译了,但无法学习。
能有人帮帮我吗?我很沮丧,因为我完全不知道为什么这个简单的模型无法学习。
回答:
这是因为你使用了ReLU激活函数,这导致参数的导数为0。使用线性激活函数可以解决这个问题。它能很好地拟合:)
你也可以尝试以某种方式改变参数的初始化器。