这是介绍我的GTO圣杯算法系列文章的第一篇。这些文章是基于我的最新著作《扑克讲座》第一卷:小筹码比赛策略。
游戏理论
博弈论是一个非常强大的数学领域,但其在现实世界的扑克应用通常很难应用。
扑克专家们经常把某个特定的玩法称为明显的GTO(博弈论最优)玩法;"Phil的加注是这里要做的GTO玩法"。但这些决定很少与游戏理论有关。它们可能更好地被描述为 "统计学最优 "或 "数学上正确 "的玩法,即专家先生认为对这手牌具有最高预期价值的玩法。
"博弈论最优 "其实是一个误导性的词汇。GTO不一定是最有利可图的打法,它只是我们对手无法利用的打法。因此,即使我们知道GTO是什么,我们也可能不想做GTO的玩法。虽然我们的下法是不可利用的,但我们可能会放弃一个更有利可图的选择,一个利用对手错误的选择。我们真正的目标应该是最大化我们的盈利能力,这通常意味着利用性地玩。尽管如此,了解正确的GTO玩法还是很重要的,尤其是在码量较少的时候。
一个简单的模式
博弈论是关于博弈的数学理论,但不是每一种类型的博弈。博弈论只涉及至少两个竞争者之间的策略博弈,在这种博弈中,每个玩家的策略可以调整以适应对手的策略。它本质上是一种优化调整的理论。
剪刀石头布,这是一个简单的游戏,在两个玩家之间进行。每个玩家同时用伸出的手形成三种可能的形状之一:石头、布或剪刀。石头压碎剪刀,剪刀剪断布,布包住石头。
这是一个很好的游戏,可以说明博弈论的一些基本原理。张三和李四各自在大量游戏的结果上下注1。假设张三一开始总是出石头。李四喜欢布。所以,一开始,张三每次都会输。但张三聪明起来,改用剪刀,现在张三每次都赢。最后李四意识到,他需要在每一次选择的时候,正好有1/3的时间是随机的。
李四的策略是博弈论最优策略。无论张三采用什么策略,从长远来看,李四都会实现收支平衡。当李四采用他的GTO策略时,张三可能采用的任何策略都不能降低李四的胜率。然而,如果李四意识到张三更喜欢石头,李四可以偏离他的GTO策略,更频繁地选择布。这将是一种利用性策略。
扑克中的博弈论
剪刀石头布是理解博弈论基本思想的有用模型,但它不能帮助我们决定在扑克游戏中做什么。事实上,我们从剪刀石头布博弈论中学到的一些概念并不适用于扑克情况。例如,当李四用GTO时,无论张三玩得多么糟糕,他都能保证收支平衡。但是一个完美的GTO扑克玩家,如果他的对手都在犯错,他就会盈利,而不是盈亏平衡。
扑克中还有其他考虑因素。泡沫、跳付、ICM和筹码效用都会影响我们最赚钱的玩法是什么。尽管如此,知道在特定情况下的GTO玩法是什么,是非常有价值的。
GTO解算器和全下图表
我个人的圣杯追求是开发一种GTO open-shoving策略,用于全桌现场比赛情况下,有效筹码少于30BB的情况。这是一个艰巨的目标,因为有数百种情况需要学习。这也是只有一小部分锦标赛玩家打出准确的GTO策略的主要原因。
我们的第一步是确定各种情况下的GTO推牌范围。有很多免费的工具我们可以用来做这件事,比如:
预先配置的表格或简单的应用程序。SnapShove是一个特别有用的方法,可以探索各种参数如何影响我们的GTO范围。然而,这些解决方案都不是真正的GTO解决方案。他们只是在一个查找表中编译预先计算好的答案。
SimpleNash 是一个真正的GTO求解器,而且免费。SimpleNash在更宽的初始条件范围内提供了比简单应用更详细的输出。它的主要缺点是缺少任何说明手册。
ICMIZER3是SimpleNash的升级版。它具有更完善的功能以及更好的文档和更好的界面。它的缺点是需要每月订阅费。ICMIZER3功能强大,易于学习,并且是我用于GTO计算的求解器。
要考虑的第一个关键变量是盲注结构。antes的存在决定了我们open-shoving成功时赢多少筹码。不同的ante结构产生不同的GTO图表。传统的下注会根据比赛级别和发牌玩家的数量产生不同的彩池。我选择使用大盲注结构作为我的基本GTO策略,因为它总是产生相同的2.5BB彩池。然后我们可以根据当前情况下彩池中的实际金额来调整我们的策略。
第二个关键变量是我们的位置。很明显,我们在按钮上的GTO open-shoving范围会比在UTG上大。
第三个关键变量是我们的有效筹码大小。在对战中,较小的筹码大小才是最重要的。但是随着玩家的增多,这个问题会变得更加复杂。我将在这里回避这个问题,暂时假设Hero的筹码和有效筹码是一样的。
图1显示了当我们在按钮上有16个BB有效筹码和等效的BBA的open范围。这个范围包括所有起手组合的35.9%,如图右下角所示。请注意,图表显示了每个组合的EV。您必须单击“编辑”按钮来显示实际的35.9% GTO open-shoving图表。
图1.ICMIZER3的输出画面 16个BB的ICMIZER3输出画面。按钮的全下范围是35.9%。每当我们至少有50%的时间全下时,一个组合就会出现阴影。
GTO Open-Shoving总图
我使用ICMIZER3计算每个桌位的GTO open-shoving范围,并且叠加到30个BB。图2总结了一个9手牌桌的这些结果。"筹码"参数是盲注和antes发布后的有效筹码大小。
在牌桌上有没有一个实际的方法来使用这些信息?假设我们在按钮上有16个有效BB。我们在发牌前看我们的图表,发现我们的开牌范围是35.9%。发牌后,我们发现T9o。这是否在我们的开仓范围内?是的,但这些信息很难记住。我们需要另一种创新,以便在实战桌上使用。
结论
我们大多数人根本不屑于在满桌玩GTO,因为学习时间太长,记忆要求太难。我们的结论是,我们的时间最好花在更实用的技能上,比如读牌。然后我们说服自己,反正GTO不是很重要,因为没有人玩它。了解我们的GTO范围,有勇气使用它们,以及判断何时使用它们,是用短码玩牌的关键技能。
Steve Selbrede
退休的硅谷工程师,活跃的扑克牌研究者和七本扑克牌书籍的作者,包括他最新的扑克牌讲座,第一卷:小型筹码GTO锦标赛策略(圣杯算法)。