gta6吧 关注:244,710贴子:4,661,468
  • 5回复贴,共1

根据强化学习做出的21点决策表

只看楼主收藏回复

算法基于强化学习里面的蒙特卡洛决策的柔性同侧回合更新策略,迭代训练了50万次,结论仅供参考和娱乐祝大家在D场和空中公寓赢得开心。
绿色代表玩家所拿的牌,紫色的数字表示庄家显示的那一张牌。


IP属地:广东1楼2022-11-23 16:08回复
    IP属地:广东2楼2023-11-12 13:52
    回复
      IP属地:广东3楼2023-11-12 13:54
      回复
        这就去试试,输大钱了找你问罪


        IP属地:北京4楼2023-11-12 14:10
        收起回复
          不用试了,庄家会出千的


          IP属地:广东来自Android客户端5楼2023-11-12 14:58
          回复