Home IT技术使用神经网络在线估计Q-表

使用神经网络在线估计Q-表

IT技术 xiaolong · 2025年4月7日 · 0 Comment

当我在强化学习中使用Q-表来保存状态-动作时，有些状态从未（或很少）发生，状态-动作值在最大迭代次数之前一直保持为零，因此我决定使用神经网络在线估计Q-表，而不是使用Q-表。

哪种类型的神经网络可以更准确地估计这类问题？这种解决方案对我有帮助吗？

回答：

我使用局部加权回归（LWR）作为函数近似，并简单地用这个函数替换表格

machine-learning neural-network q-learning

发表回复取消回复