Home dynamic-programming

dynamic-programming

### 理解策略和价值函数的强化学习

xiaolong · 2025年4月12日 · 0 Comment

已关闭。此问题不涉及编程或软件开发。目前不接受回答。…

Q-learning 更新频率

xiaolong · 2025年4月12日 · 0 Comment

在Q-learning中，智能体从当前状态出发，在每个…

Q-learning与动态规划

xiaolong · 2025年4月11日 · 0 Comment

经典的Q-learning算法使用查找表（而不是函数近…

在C语言中计算使用哪个函数（或代码类型）

xiaolong · 2025年4月4日 · 0 Comment

我有一个有点不寻常的问题。假设我有N个函数： void…

在Q学习中添加约束并在违反约束时分配奖励

xiaolong · 2025年4月4日 · 0 Comment

我最近参加了一个强化学习课程，正在为一个电力管理应用编…