扑克_德州扑克

扑克
德州扑克学习之家

AI与Solver(下)

扑克AI与Solver(下)

上篇文章我们讨论了扑克中,AI与solver的原理,实现路径以及缺点。强烈建议你在打开这篇文章之前,先看过我们上篇文章。

扑克AI与Solver(上):https://www.poker588.com/a/3809.html

这篇文章我们将讨论这些软件工具是如何帮助我们精进我们的扑克技术的。

在讨论软件如何帮助我们进步之前我想先提出一个问题。就是AI,solver这类软件工具,在处理扑克问题的时候与我们人类区别在哪里?

一言蔽之,哪些事情是软件能做到,人做不到的?


首先,计算机拥有超强的存储能力,在能得出结果的前提下,只要硬盘足够大,就可以精确的的存储所有的策略。而对于人类,(⊙﹏⊙)翻前策略那几百张图你记住了吗?


第二,高速精确的搜索能力,只要算法足够好。计算机就牌面和出牌的评估能力是远远超过人类玩家的,在算法面前,没有经受过训练的人类处理牌面问题,只能说是依靠直觉进行猜想。


第三,软件算的清楚策略,这个清楚不但能定性,而且能定量。只有计算机能承担如此巨大的计算量,清楚的计算某手牌的策略 期望,权益究竟是多少。而人完全无法做到,只能猜想,某个策略也许比较好,期望也许比较高。

而人的直觉性猜想在扑克的一些复杂性情况下往往是有错误的。


第四,软件在算法的支持下,有最大化期望的能力。什么是最好的策略,在扑克中,这个问题的答案是,最大化自己期望的策略。人类玩家在处理扑克问题的时候,没有计算期望的能力,而软件在CFR算法的支持下,可以做到这一点。


那么在这两类软件中,我们需要从solver中学到什么呢?


1.使用solver的学习的时候,先分类。正如我们上个视频中学到的,solver是一个多输入的函数,那么我们在研究的时候需要学会控制变量法。将大问题拆解成若干个不同的小问题。

比如对有效筹码的分类,对位置范围的分类等等。


2. 在扑克学习中学会问出一个精确的问题。在我的培训生涯中,我常常遇到同学们问出一个个模糊的问题。比如这手牌这么打好不好?如果你学习过solver,那么判断策略的好坏是有精确的输入条件进行判断的。


3. Solver给出的策略结果是高度复杂的,人在学习的时候依旧需要从中进行聚类和抽象。转化成人可以学习使用的一个个小套路。

最后,我要破除一个长久以来扑克社区的误解——很多人会建议学生像solver一样思考,而事实上,solver是不会像人一样做逻辑推断的,他是在一定条件下通过类似穷举的方法得到结论,这种方法人学不会,也学不来。


接下来,我们要讨论的是,人从AI中应该学到什么?


1. 我们也要学着去和AI对抗,来看自己抽象聚类的规律是否是正确的,有没有什么样的异常值。关于这一点,训练营开发了自有的训练工具扑克字典,可以和基于solver结果的GTO机器人实时对战,即刻知道自己的策略是否正确。


2. AI并不受情绪波动的影响,而人在扑克游戏过程中容易受情绪波动导致失误,我们要学会成为一个没有感情的杀手。


3. 模仿AI软件的决策路径,这个话题我们之前已经讨论过,这里不再重复。


德州扑克:扑克_德州扑克 » AI与Solver(下)

扑克_德州扑克学习之家

扑克 德州扑克
Processed in 0.284176 Second , 83 querys.