击败庄家21点策略表,21点庄家可以看自己的底牌吗

首页 > 经验 > 作者:YD1662024-03-28 01:50:37

获胜或平局的概率随玩家初始手牌总点数的变化(柱形越长概率越大!)

接下来的图说明了神经网络是如何胜过朴素策略的。根据我们的代码,哪怕玩家存在极小的爆牌风险,朴素策略都不愿意冒险选择拿牌。另一方面,在玩家初始手牌的总点数为12、13、14或15时,神经网络更倾向于选择拿牌。这种细微变化的决策和计算风险的能力似乎是神经网络优于朴素策略的原因。

击败庄家21点策略表,21点庄家可以看自己的底牌吗(9)

神经网络与朴素策略选择拿牌的趋势随玩家初始手牌总点数的变化

我们可以看看当玩家手牌总点数在12到16之间,时神经网络做了什么来尝试改善我们的朴素策略(尽量少输钱给赌场)。

当庄家的明牌点数较大(8、9或10)时,神经网络非常倾向于拿牌。但即使庄家的明牌点数较小(例如3),神经网络在60%的情况下仍然选择拿牌,这是因为神经网络在做出决定时会考虑其可使用的所有特征。因此,我们无法轻易将其决策提炼为一些简单的经验法则。

击败庄家21点策略表,21点庄家可以看自己的底牌吗(10)

神经网络选择拿牌的频率随庄家明牌的变化

结论

希望这篇文章对于使用机器学习协助实现生活中的决策给出了合适的解释。训练自己的模型时,请牢记以下几点(无论是决策树、回归还是神经网络):

是否通过预测目标变量,就能解决眼前的问题? 在开始收集数据和建立模型之前,至关重要的是要确保你选择了正确的预测目标。

实际数据与训练数据会有什么不同?如果两者差别很大,那么网络模型可能不是解决问题的正确答案。至少我们必须意识到这一点,并采取措施,例如模型的正则化和严格(并诚实)的验证以及测试集基准的选择。

不明白决策如何形成,就无法理解和利用模型训练过程中未包含的测试数据来理智地检查模型的决策。

最后我想就21点这个游戏说几句。我可能接下来一段时间不会再讨论有关赌博的话题了(我想探索的话题太多了)。 但如果有人有兴趣继续探讨这个话题(无论是否使用我的代码),可以考虑进行一些有趣的扩展:

  1. 可以尝试通过更优化的神经网络结构来改善模型,或者添加用于拆分牌A的代码(我没有将其构建到原始模拟器中),或者选择比我使用的基本特征集更优的特征集。
  2. 为模型添加计算总点数的能力,并观察总点数在一副牌和六副牌(拉斯维加斯标准)时是怎样影响模型表现的。

链接:

https://towardsdatascience.com/teaching-a-neural-net-to-play-blackjack-8ec5f39809e2

编辑:于腾凯

校对:王欣

— 完 —

关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

上一页123末页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.