在蒙特卡罗模拟中,“最后一次有效回复”和“快速动作价值估计”的概念是什么?

我已经开发了一个基于蒙特卡罗树搜索的简单六角棋玩家,用…