德州扑克RL智能体【附代码】"/>
DRL应用实战(一)——开发德州扑克RL智能体【附代码】
1 pettingzoo德州扑克-无限制版 游戏规则
观测空间:一个54维的向量,每一维取值为0或1,1表示出现,0表示没出现。
索引 | 含义 | 取值 |
---|---|---|
0~12 | 黑桃A~K | [0,1] |
13~25 | 红心A~K | [0,1] |
26~38 | 方块A~K | [0,1] |
39~51 | 梅花A~K | [0,1] |
52 | 玩家1下注的总筹码 | 1~100 |
53 | 玩家2下注的总筹码 | 1~100 |
动作空间:一个6维的向量,每一维取值为0或1,1表示选择该动作。
动作ID | 动作 |
---|---|
0 | Fold / 弃牌 |
1 | Check / 让牌 / 过牌 |
2 | Call / 跟注 |
3 | Raise Half Pot / 加注和奖金池的一半等值的筹码 |
4 |
更多推荐
DRL应用实战(一)——开发德州扑克RL智能体【附代码】
发布评论