Home IT技术强化学习中的SARSA

强化学习中的SARSA

IT技术 xiaolong · 2025年4月15日 · 0 Comment

我在研究无模型强化学习中的SARSA算法。具体来说，在每个状态下，你会采取一个动作a，然后观察到一个新的状态s'。

我的问题是，如果你没有状态转移概率方程P{next state | current state = s0}，你如何知道下一个状态会是什么？

我的尝试：你是否只是尝试那个动作a，然后从环境中观察结果？

回答：

通常是的，你在环境中执行该动作，然后环境会告诉你下一个状态是什么。

algorithm machine-learning reinforcement-learning

发表回复取消回复