Unity提供了两种训练智能体的强化学习算法:PPO和SAC。
我已经寻找了几周,试图了解如何编写自己的算法,只找到了一个名为gym-unity的包装器,它包装了Unity环境,我可以使用Gym来编写我的算法。然而,这个包装器的文档毫无用处,我无从下手。
我的问题是:(1) 如何将自定义编写的强化学习模型导入Unity?(2) 是否有更好的包装器文档?
回答:
你可以查看我的仓库genetic-unity,它使用ML-Agent包实现了进化算法。
我没有使用他们实现的智能体(PPO和SAC),而是使用了Unity和Python之间的接口来编写我自己的算法,如果我理解正确的话,这正是你所寻找的。
你可以从genetic_algorithm.py
文件开始,看看我是如何处理Unity环境的。
然而,你应该注意,这项工作是在9个月前完成的,ML-Agent框架变化很快,可能你需要做一些调整。