我目前正在使用Unity的“mlagents”,但遇到了一个问题。
问题:当我调用“AddReward”函数时,累积奖励不会超过我在括号中设置的值。
例如:
AddReward(0.1f); //--- 我增加了一个奖励Debug.Log(GetCumulativeReward()); //--- 打印累积奖励
当我调用这个函数时,它直接跳到0.1并停留在那里,即使我再次调用它也是如此。如果我输入“-0.1”,它会跳到-0.1并停留在那里。
我尝试过的方法:
- 确保我调用的是“AddReward”而不是“SetReward”
- 使用“SetReward”并在括号中输入“GetCumulativeReward() + 1”
这两种方法都不奏效
有什么解决方案吗?
更新:GetCumulativeReward() 返回的是该回合的奖励,而不是所有回合的奖励,所以没有问题
回答:
更新:GetCumulativeReward() 返回的是该回合的奖励,而不是所有回合的奖励,所以没有问题