DRL应用实战(一)——开发德州扑克RL智能体【附代码】

编程入门 行业动态 更新时间:2024-10-18 06:09:02

DRL应用实战(一)——开发<a href=https://www.elefans.com/category/jswz/34/1722572.html style=德州扑克RL智能体【附代码】"/>

DRL应用实战(一)——开发德州扑克RL智能体【附代码】

1 pettingzoo德州扑克-无限制版 游戏规则

观测空间:一个54维的向量,每一维取值为0或1,1表示出现,0表示没出现。

索引含义取值
0~12黑桃A~K[0,1]
13~25红心A~K[0,1]
26~38方块A~K[0,1]
39~51梅花A~K[0,1]
52玩家1下注的总筹码1~100
53玩家2下注的总筹码1~100

动作空间:一个6维的向量,每一维取值为0或1,1表示选择该动作。

动作ID动作
0Fold / 弃牌
1Check / 让牌 / 过牌
2Call / 跟注
3Raise Half Pot / 加注和奖金池的一半等值的筹码
4

更多推荐

DRL应用实战(一)——开发德州扑克RL智能体【附代码】

本文发布于:2024-02-06 03:03:34,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1745652.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:德州   扑克   实战   代码   智能

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!