openai-gym – 学技术

IT技术

OpenAI Gym – 迷宫 – 使用Q学习- “ValueError: dir不能为0。有效的方向只能是dict_keys([‘N’, ‘E’, ‘S’, ‘W’])。”

xiaolong · 2025年5月30日 · 0 Comment

我正在尝试使用Q学习来训练一个智能体来解决迷宫问题。 …

IT技术

使用自定义模拟器与Ray RLlib

xiaolong · 2025年5月30日 · 0 Comment

我刚开始接触Ray RLlib，并且在使用我们团队制作…

IT技术

OpenCV + gym-retro: 输入图像通道数无效

xiaolong · 2025年5月29日 · 0 Comment

我一直在尝试使用gym-retro和OpenCV。我查…

IT技术

在尝试使用DQN算法玩FrozenLake OpenAI游戏时遇到的错误

xiaolong · 2025年5月29日 · 0 Comment

我试图让一个非常简单的DQN算法与FrozenLake…

IT技术

Python强化学习 – 元组观测空间

xiaolong · 2025年5月25日 · 0 Comment

我创建了一个自定义的OpenAI Gym环境，具有离散…

IT技术

OpenAI Gym环境’CartPole-v0’和’CartPole-v1’之间的区别

xiaolong · 2025年5月25日 · 0 Comment

我找不到关于OpenAI Gym环境’Ca…

IT技术

如何让Python智能体进行观察？

xiaolong · 2025年5月24日 · 0 Comment

我正在尝试创建一个简单的Python智能体，能够在游戏…

IT技术

我需要帮助理解强化学习代码

xiaolong · 2025年5月22日 · 0 Comment

我一直在尝试解决OpenAI的MountainCarC…

IT技术

为什么我会遇到’No module named OpenAI’的导入错误？

xiaolong · 2025年5月22日 · 0 Comment

我在尝试制作一个机器人来训练Universe中的一个环…

IT技术

OpenAI gym 玩家模式

xiaolong · 2025年4月14日 · 0 Comment

有人知道如何以玩家的身份运行 OpenAI gym 环…

IT技术

策略梯度方法用于Open AI Gym Cartpole

xiaolong · 2025年4月14日 · 0 Comment

我是一个强化学习的初学者，正在尝试使用Tensorfl…

IT技术

OpenAI baselines: 为什么同时使用`tf.stop_gradient`和指定`var_list`？

xiaolong · 2025年4月12日 · 0 Comment

在OpenAI baselines的代码中，关于DQN…

IT技术

OpenAI gym and Python threading

xiaolong · 2025年4月12日 · 0 Comment

我正在研究A3C/ACER的一个变体，我有多个工作线程…

IT技术

OpenAI Gymnasium，有没有支持它的算法库？

xiaolong · 2025年4月5日 · 0 Comment

OpenAI发布了一个名为Gymnasium的新库，旨…

IT技术

### 使用Stable-Baselines3训练自定义环境时未监控到回合统计数据

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试使用Stable-Baselines3和Op…

IT技术

使用Matplotlib绘制比例三角形

xiaolong · 2025年4月5日 · 0 Comment

我的三角形绘制看起来不对称，我如何使它成比例？ poi…

IT技术

Render() 在健身房环境中不起作用

xiaolong · 2025年4月5日 · 0 Comment

我正在进行一个针对《打砖块》游戏的强化学习项目，我的环…

IT技术

在使用gym的env.step时，出现’>=’不支持在’int’和’str’实例之间的错误

xiaolong · 2025年4月5日 · 0 Comment

我有以下代码，每次运行时都会出现一个错误，提示’&gt…

IT技术

在超级马里奥兄弟游戏中前进的奖励

xiaolong · 2025年4月5日 · 0 Comment

如何奖励一个在类似超级马里奥兄弟的游戏中前进的智能体？…

IT技术

能否在训练前和训练过程中修改OpenAI gym的状态？

xiaolong · 2025年4月5日 · 0 Comment

我想做的就是修改一个环境，例如使用超级马里奥兄弟的gy…

IT技术

为什么我们在深度强化学习中需要与均匀分布进行比较来选择动作，而策略函数已经完成了这个任务？

xiaolong · 2025年4月5日 · 0 Comment

在由Karpathy编写的以下代码中，为什么我们需要这…

IT技术

OpenAi Gym 安装 – Python 版本不匹配

xiaolong · 2025年4月4日 · 0 Comment

我在一个全新的 Ubuntu 16 虚拟机上尝试安装 …

IT技术

如何提升机器学习 – DQ学习模型的性能

xiaolong · 2025年4月4日 · 0 Comment

DQlearning中的月球着陆器表现不佳，因此我尝试…

IT技术

如何正确实现DQN算法

xiaolong · 2025年4月4日 · 0 Comment

我正在尝试实现DeepMind在这篇论文中介绍的深度Q…

IT技术

如何在OpenAI中创建新的健身房环境？

xiaolong · 2025年4月4日 · 0 Comment

我有一个任务，需要制作一个AI代理，通过机器学习来学习…