reinforcement-learning – 第 6 页

IT技术

如何将强化学习应用于连续动作空间？

xiaolong · 2025年4月6日 · 0 Comment

我正在尝试让一个智能体学习在强化学习环境中完成某项任务…

IT技术

如何训练人工神经网络通过视觉输入玩《暗黑破坏神2》？

xiaolong · 2025年4月6日 · 0 Comment

已关闭。此问题与编程或软件开发无关。目前不接受回答。…

IT技术

变量动作的强化学习

xiaolong · 2025年4月6日 · 0 Comment

我所阅读过的所有强化学习算法通常都是应用于单个智能体，…

IT技术

### 强化学习玩具项目

xiaolong · 2025年4月6日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

C#中的强化学习

xiaolong · 2025年4月6日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …

IT技术

使用神经网络进行强化学习

xiaolong · 2025年4月6日 · 0 Comment

已关闭。此问题与编程或软件开发无关。目前不接受回答。…

IT技术

强化学习与部分可观察马尔可夫决策过程

xiaolong · 2025年4月6日 · 0 Comment

已关闭。此问题与编程或软件开发无关。目前不接受回答。…

IT技术

OpenAI Gymnasium，有没有支持它的算法库？

xiaolong · 2025年4月5日 · 0 Comment

OpenAI发布了一个名为Gymnasium的新库，旨…

IT技术

### 使用Stable-Baselines3训练自定义环境时未监控到回合统计数据

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试使用Stable-Baselines3和Op…

IT技术

使用Matplotlib绘制比例三角形

xiaolong · 2025年4月5日 · 0 Comment

我的三角形绘制看起来不对称，我如何使它成比例？ poi…

IT技术

在自定义环境中应用Q-learning的问题（Python，强化学习，OpenAI）

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试将Q-learning应用于我自定义的强化学…

IT技术

Render() 在健身房环境中不起作用

xiaolong · 2025年4月5日 · 0 Comment

我正在进行一个针对《打砖块》游戏的强化学习项目，我的环…

IT技术

如何使用井字游戏数据集训练深度强化学习网络

xiaolong · 2025年4月5日 · 0 Comment

大家好，我是神经网络的新手。我用Python编写了以下…

IT技术

在使用gym的env.step时，出现’>=’不支持在’int’和’str’实例之间的错误

xiaolong · 2025年4月5日 · 0 Comment

我有以下代码，每次运行时都会出现一个错误，提示’&gt…

IT技术

x 超过了系统可用内存的10%，尽管还有很多可用内存

xiaolong · 2025年4月5日 · 0 Comment

每次我尝试运行 model.predict() 时，如…

IT技术

ValueError: 层 “max_pooling2d” 的输入 0 与该层不兼容：期望的维度数为4，但发现的维度数为5。接收到的完整形状为：(None, 3, 51, 39, 32)

xiaolong · 2025年4月5日 · 0 Comment

我同时遇到了两个不同的问题。我在使用MaxPooli…

IT技术

密集层给我返回二维数组

xiaolong · 2025年4月5日 · 0 Comment

我在为CartPole进行强化学习时遇到了这个问题 m…

IT技术

在超级马里奥兄弟游戏中前进的奖励

xiaolong · 2025年4月5日 · 0 Comment

如何奖励一个在类似超级马里奥兄弟的游戏中前进的智能体？…

IT技术

训练AI算法学习新功能

xiaolong · 2025年4月5日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

为什么q_net有这么多数量的输入层？

xiaolong · 2025年4月5日 · 0 Comment

我正在按照这个教程（https://www.tenso…

IT技术

PyTorch RuntimeError: 维度超出范围（期望在[-1, 0]范围内，但得到1）

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试训练一个包含LSTM的Actor Criti…

IT技术

LSTM PyTorch 运行时错误：期望的 hidden[0] 大小为（1, 1, 256），得到的却是（1, 611, 256）

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试使用 nn.lstm 进行批处理根据文档 …

IT技术

强化学习中的Actor在初始训练期间预测相同动作

xiaolong · 2025年4月5日 · 0 Comment

我有一个带有LSTM的强化学习Actor Critic…

IT技术

使用LSTM训练模型需要多少个epoch

xiaolong · 2025年4月5日 · 0 Comment

我在我的AI中使用了带有LSTM的神经网络Actor …

IT技术

为什么我们在深度强化学习中需要与均匀分布进行比较来选择动作，而策略函数已经完成了这个任务？

xiaolong · 2025年4月5日 · 0 Comment

在由Karpathy编写的以下代码中，为什么我们需要这…