在使用函数近似的Q学习中,是否可以避免手工制作特征?

我对机器学习的背景知识不多,如果我的问题看起来很傻,请…

如何在强化学习的函数逼近中更新权重?

我的使用梯度下降的SARSA算法导致权重呈指数级增长。…