对于一个人工智能课程项目,我需要实现一种强化学习算法,它可以击败一个简单的俄罗斯方块游戏。这个游戏是用 Java 编写的,我们有源代码。我知道强化学习理论的基础知识,但想知道 SO 社区中是否有人有这方面的实践经验。
- 对于在俄罗斯方块游戏中实现强化学习,您会推荐哪些读物?
- 是否有任何好的开源项目可以完成类似的事情,值得研究?
越具体越好,但也欢迎关于该主题的一般资源。
后续:
这是我最终为未来的学生提供的解决方案(代码和文档):
回答:
看看 2009 年的 RL-competition。其中一个问题领域是俄罗斯方块游戏。前一年也有一个俄罗斯方块问题。这是当年第五名决赛选手的 52 页的最终报告,其中详细介绍了代理的工作原理。