强化学习找金币游戏Gym环境测试调试问题

编程入门 行业动态 更新时间:2024-10-10 11:24:35

强化学习找<a href=https://www.elefans.com/category/jswz/34/1752570.html style=金币游戏Gym环境测试调试问题"/>

强化学习找金币游戏Gym环境测试调试问题

强化学习找金币游戏Gym环境测试调试问题

  下图为机器人在网格世界找金币的示意图。该网格世界一共有8个状态,其中状态6和状态8为死亡区域,状态7为金币区域。机器人的初始位置为网格世界中任意一个状态。机器人从初始状态出发寻找金币。机器人进行一次探索,进入死亡区域或找到金币,本次探测结束。
  机器人找到金币的回报为1,进入死亡区域回报为-1,机器人在区域1-5之间转换时,回报为0。
  目标是找到一个策略使得机器人不管处在什么状态(1-5)都能找到金币。

  在《深入浅出强化学习:原理入门》一书中给出找金币游戏的Gym开发环境代码,grid_mdp.py文件中。如下:

为自己强化学习代码在Gym中进行环境配置

  1. 第⼀步,将我们⾃⼰的环境⽂件(grid_mdp.py) 拷⻉gym安装⽬录/gym/envs/classic_control⽂件夹中(拷⻉在此⽂件夹中是因为要使⽤rendering模块)。
  2. 第⼆步,打开该⽂件夹(第⼀步中的⽂件夹)下的_init_.py⽂件, 在⽂件末尾加⼊语句:
    from gym.envs.classic_control.grid_mdp import GridEnv
  3. 第三步,进⼊⽂件夹的gym安装⽬录/gym/gym/envs,打开该⽂件夹下 的_init_.py⽂件,添加代码如下。 第⼀个参数id就是你调⽤gym.make(‘id’)时的id,这个id可以随便选取,源代码取名GridWorld-v0。
register(id='GridWorld-v0',entry_point='gym.envs.classic_control:GridEnv',max_episode_steps=200,reward_thre

更多推荐

强化学习找金币游戏Gym环境测试调试问题

本文发布于:2024-02-07 01:29:54,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1752341.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:金币   环境   测试   游戏   Gym

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!