我是强化学习的新手,我读了一些关于Actor Critic和DDQN这两种算法的资料。我发现这两种算法都能得到相当不错的结果。但由于这两种算法完全不同,所以我想知道在哪些情况下我应该优先选择Actor Critic,而在哪些情况下应该选择DDQN。另外,使用Actor Critic相较于DDQN的优点和缺点是什么?
回答:
我认为来自《Deep Reinforcement Learning for Multi-Agent Systems: A Review of Challenges, Solutions and Applications》的以下图片回答了你的问题: