立即玩

Join Best Online Poker Site. Enjoy Real Money online Poker Bonuses

Rich Zhu在2+2论坛发表的GTO理论(下) Rich Zhu在2+2论坛发表的GTO理论(下) Rich Zhu与GTO理论(上):https://www.moshike.com/a/1788.html

Rich Zhu在2+2论坛发表的GTO理论(下)

Rich Zhu与GTO理论(上):https://www.moshike.com/a/1788.html

1. GTO的定义是什么?

A:GTO是一种基于NE(纳什均衡)的游戏策略。纳什均衡适用于非合作博弈/零和博弈。纳什均衡定义:在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。一个策略组合被称为纳什均衡,是当每个博弈者的支配性策略都是为了达到自己期望收益(EV)的最大值,与此同时,其他所有博弈者也遵循这样的策略。根据以上,GTO策略的定义就是每个完全理性的博弈者都达到自己期望收益(EV)的最大值的策略组合。

2. GTO是一种不会输的策略吗?

A:任何策略都会输,这是NLH的波动性(或样本方差)决定的。GTO策略当然也会输,但是我们从定义上可得,采用GTO策略,你哪怕输,也不会损失EV。长期(long run)来看,一个重复进行的游戏,你的获得的价值必将等于你策略的EV值。

3. 那么长期是多长?

A:长期是一个统计学的概念。在CASH中,长期和你的百手盈利和session方差有关;在MTT/SNG中,长期和你的ROI(投资回报率)和比赛盈亏方差有关。具体计算方法可见前面的专栏。

4. GTO是一种防守的策略吗?

A:错。GTO是一种攻守兼备的策略,它具有不亚于LAG的各种进攻技巧。

5. 两个GTO选手一起打,不是都输给Rake吗?

A:Rake与GTO策略无关,无论你采用什么策略游戏,都会输Rake。哪怕你是盈利的,也是Rake后的盈利。

6. 初学者学GTO是错误吗?

A:恰恰相反。对于初学者,没有ABC、TAG、LAG等先入为主的策略的影响,反而更容易理解掌握正确的扑克理论。无论初学者学不学GTO,掌握GTO背后的全EV公式,都是至关重要的。

7. 剥削策略比GTO策略EV更高吗?

A:如果不基于均衡的策略,你的剥削策略将无从谈起。首先识别到对手有漏洞(应用贝叶斯法则),那么有多少的漏洞可供利用,有没有数学上的依据?所以必须掌握GTO策略才能用好MES策略。如果对手是一个前述有固定漏洞的玩家,MES确实比GTO的EV更高。但是对于一个不稳定易变的或极端聪明的玩家,采用剥削策略也可能被反剥削。综合来看,对于陌生的对手,GTO策略无疑是EV最大化的更好选择。

8. 对手不用GTO,我用GTO策略有没有用?

A:在双人游戏中,对手的漏洞造成的EV损失,你采用GTO策略会自动获利。这是零和游戏的基本特点。因此你采用GTO策略是完全有效的。

9. 合作博弈不能用GTO策略?

A:这个游戏的基础就是非合作博弈,如果存在有意的合作博弈,你用任何策略都打不赢。这不是用不用GTO策略的问题。

10. 多人池能不能用GTO策略?

A:多人博弈也存在NE,这是角谷不动点定理证明过的。但是,多人博弈可能存在多个纳什均衡点,当你执行其中一个均衡策略时,别人有可能执行另外一个,你的GTO策略可能不是EV最大化的选择。因为第三方的漏洞造成的EV损失,你并不会自动获得。但是GTO策略(执行一个均衡点)仍是有意义的,这会保证你的保底EV。

11. 多人池NE能用软件计算吗?

A:复杂的多人博弈的NE,2018年奈望林纳奖Daskalakis证明多人博弈纳什均衡是一个PPAD-Complete问题(PPAD代表有向图的多项式校验参数),所以想以多项式解得多人博弈的纳什均衡解还是很有难度。目前MonkerSolver的多人池解是采用了大量的抽象方法,可以参考。

12. 锦标赛能不能用GTO策略?

A:可以。但是,对于锦标赛,$EV和chipEV在不同阶段并不一致,参考Icmizer。我们通常的策略、计算和solver的设置都是对Cash的,也就是算的是chipEV。严格来说,在锦标赛中,我们应该考虑的$EV最大化的GTO策略。

13. Push or Fold跟GTO策略有关系吗?

A:目前所有的Push or Fold计算器,包括Icmizer、HRC等,用的都是NE解。我们前面说过,GTO策略就是NE策略,所以你用所有软件的Push or Fold就是GTO策略。

14. Pokersnowie是GTO策略吗?

A:Pokersnowie是一个基于人工智能AI的无限注德州扑克软件。它已经学会了玩各种各样的无限注德州扑克,从单挑到10人局,从小筹码局一直到非常深的筹码局(400个大盲注)。PokerSnowie的根基是人工神经网络。它通过自我对弈,训练出最大化EV的策略,这是一种形而上的求解GTO策略的方式。但是由于下注尺度的限制,它的GTO策略的dEV(纳什距离)离真正的GTO还差得很多。一个良好训练的牌手,在Snowie的下注尺度限制下,对AI应该能达到15bb/HH的领先优势。

15. Solver是人工智能吗?

A:不是。Solver是严格按照EV公式不断逼近接近纳什均衡解,完全没有AI的要素。

16. Solver解就是GTO策略吗?

A:这和模型建立有关,越精确的模型越接近纳什均衡解,越接近GTO策略。但是,完全的GTO解不可能达到,也没有意义。对于一个混合策略,21%和20%的精确差距没有必要完全解得。

17. Solver的解算都是超近道吗?

A:这种说法是无知的。Solver是逐渐逼近纳什均衡解,并不是超近道。如果说GTO解是一个圆,Solver的解就是一个内接多边形,范围越准确,策略树越完善,这个内接多边形就越接近于圆。因为目前计算机的能力,无法穷举所有的策略树,适当的下注尺度抽象是无法避免的。但是,Solver解毕竟是目前最接近于GTO策略。

18. 为什么Solver一定要输入翻牌面Board?

A:算法上没有一定要输入翻牌面的必要。翻前有169个同构面,翻牌有1755个同构面。正是因为计算机能力的不足,所以我们才要输入翻牌。如果有一天,计算机能力无限强大,那么我们无须输入翻牌面、无须输入策略树,甚至无须输入翻前范围,就可以得到完整的GTO策略。

19. 用Solver解算就不需要懂原理?

A:Solver的解算结果确实有很多我们不能理解。但是请相信,所有的解算结果都是通过全EV公式计算出的。你要了解的是,EV计算公式,这也是所有策略的根本。

20. Solver的计算方法跟Libratus一样吗?

A:Solver的计算方法是逆向归纳法,用全EV公式从河牌开始算起,倒推翻牌的行动,所有的转牌河牌面计算好以后再进行加权聚合。Libratus采用的是MCCFR(蒙特卡洛反事实遗憾最小化),从原理上来说,和Snowie的ANN神经网络更为接近。

21. Exploititave Play有计算软件吗?

A:Solver就是最好的Exploititave Play计算软件。Exploititave Play实际上是PBE(精炼贝叶斯纳什均衡),通过贝叶斯公式推断对手的漏洞点,利用翻前范围或节点锁定输入软件,得到MES解。MES解的准确度除了和GTO解一样外,还跟贝叶斯推断的准确度有关。

22. Action频率是GTO的关键吗?

A:个人观点:执行GTO策略不用特别考虑频率。频率是多次行动的综合,你首先要保证的是行动线的正确,不能有Off-tree的行动。比如下注20%,过牌80%,你以任何比例去选择混合策略,单手牌的EV都是一样的。关键在于你的后续行动,不能脱离整个策略树。

23. 下注尺度是GTO的关键吗?

A:个人观点:对于复杂范围(非ToyGame)来说,基本上任何一个下注尺度都是合理的,都是有相应的纳什均衡的。只要你能正确选择对应下注尺度的正确范围,下注尺度并不重要。所以关键的还是行动线和避免Off-tree。

24. GTO策略一定要用翻前NE范围吗?

A:个人观点:和行动频率一样,你的单手牌并不用特别考虑频率,例如AA 4bet-50%,call 50%之类。你只需要知道这手AA有4bet和call的两种选择就可以。长期的统计才带来频率。因此,翻前是否严格采用NE范围并不重要,你可以按NE范围的频率和接近牌力,设计自己舒适的翻前范围。

25. 如何用Solver/AI练习GTO?

A:个人观点:Snowie的AI适合练习翻前范围和HU,通过长期训练对各个位置的范围形成肌肉记忆。HU的训练会大大提高你翻后的能力。而Solver Trainer(如GTO+的PAS)是对行动线训练的最好工具,具体方法见以前专栏。

6

德州扑克到底用不用学习

其实,说起来这个话题两方都有不同的观点,他们可能是从科研学术的角度来论述。

我从玩家的角度来说,个人认为,学习不学习GTO,对你成绩的提高并不是最重要的。每个人首先要明确你打牌的目的。简单把国内玩家做一下分类。

1.娱乐玩家。有的人打牌就是为了娱乐,他资金管理的很好,每月投入几千元娱乐就好像一个喜欢打游戏的人充值一样。只享受过程。

2.半娱乐玩家。之所以这么区分,是他们还有一套自己的理论,成绩基本上也是能够持平,甚至略盈利,打牌的主要目的还是娱乐。

3.半职业玩家。他们的水平总体领先,扑克收入对他的生活有一定影响。但不是主业。

4.职业玩家。这部分人是处于扑克行业金字塔顶端的人群。他们每天致力于研究扑克博弈。高水平玩家。

对于2+2论坛的娱乐玩家来说,不用学习。你的目的是娱乐。好像有的人是被虐待狂一样,有的人享受失败的过程。

对于半娱乐玩家来说,也可以不学习。享受的过程还能体会盈利的美妙,岂不快哉!

对半职业和职业玩家来说,学习是必要的。目前除了找教练学习外,自己通过软件模拟构建对手的范围,选择适合的行动是可行的。对顶尖职业玩家来说,已经是行业内的5%了,想进入到3%是很难的过程。这个提高可能就是一个1%的ev差距。有的是通过学习的,有的是天分,真的是没法学习的。

但是你可以提高自己选桌的能力。可以提高自己情绪控制,来弥补。

你打扑克的目的是什么?是为了赢吗?我多次说过,田忌赛马,去多花时间挑选牌桌。能大大提高你的盈利。比赛另论。

FAQ

WPK-微扑克 是否有代理合作机会?

WPK-微扑克 是否有代理合作机会?

是的,我们是官方渠道,WPK-微扑克 俱乐部欢迎全球德州玩家合作代理,并提供返佣政策。如有其他问题,请随时访weipuke.org联系我们的客服。

WPK-微扑克 游戏资金出入安全有保证吗?

WPK-微扑克 游戏资金出入安全有保证吗?

官方俱乐部,有资金保证,上下分没有限制,出入秒到帐,适合不同资金实力的玩家。如有其他问题,请随时访weipuke.org联系我们的客服。

WPK-微扑克 虚拟币充值双重送 FAQ

WPK-微扑克 虚拟币充值双重送 FAQ

1. 什么是 WPK-微扑克 虚拟币充值双重送活动?

WPK-微扑克 虚拟币充值双重送活动是针对使用USDT充值的玩家,提供丰厚的返还优惠。

2. WPK-微扑克 活动的具体内容是什么?

通过使用USDT进行充值,玩家可以享受高达上万元的优惠。

3. 在 WPK-微扑克 中,如何获得首充返还?

活动中,USDT首充或再存即享100%返还,最高可获得¥8888的返还。

4. WPK-微扑克 充值双重送活动的时间限制是多久?

具体的活动时间请关注俱乐部的公告或咨询客服。

5. 我需要满足什么条件才能参与 WPK-微扑克 的充值活动?

参与活动的玩家需使用USDT进行充值,且需遵循相关的活动规则。

6. WPK-微扑克 充值活动是否适用于所有玩家?

活动适用于所有符合条件的玩家,具体详情请咨询weipuke.org微扑克客服

WePoker注册后无法登录怎么办?

WePoker注册后无法登录怎么办?

请先确认您的所在地是否在「中国、香港、澳门、马来西亚」等地区,其他地区需要透过VPN登录。

请问如何下载WePoker客户端?

请问如何下载WePoker客户端?

请先透过"立即下载"按钮,注册后WePoker系统将会自动引导下载游戏。

本網站僅收集相關文章。如需查看原文,請複製並打開以下連結:Rich Zhu在2+2论坛发表的GTO理论(下)

🎗️ 最新文章 🎗️ 📹 熱門文章 💋
🎼 推薦文章 😉

微扑克(wepoker)便捷充值钻石攻略 微扑克(wepoker)是一款备受欢迎的扑克游戏平台,而钻石则是在游戏中必不可少的一种虚拟货币。有些玩家在充值钻石时可能会遇到一些困扰,不知

线下德州扑克牌桌马脚 线下德州扑克牌桌马脚 很多人在打牌的过程中有意无意的都会通过一些下意识的行为和表情泄露自己的牌力,我们之前也为大家介绍过一些扑克中的马脚(Te

不同底牌在翻牌后组成牌型的概率 今天我们给大家分享各种不同底牌在翻牌圈(flop)组成各种牌型的概率,现在我们来看看这些奇妙的数字吧! 一.手牌任意两张(非对子)的情况 1.啥

德州扑克ICM介绍:什么是独立筹码模型? 德州扑克ICM介绍:什么是独立筹码模型? 在理论盛行的现代,完全凭感觉打扑克锦标赛的时代早已一去不复返了。 几年前,胜率和赔率等基本数学术语的引

德州扑克的潜在机会成本 德州扑克的潜在机会成本 Hello大家好,我是Marty Mathis,也许你们更熟悉我的另外一个名字——TheLipoFund,这是我扑克之星

德州扑克底池赔率 德州扑克底池赔率 底池赔率(Pot Odds)是一个几乎所有常客玩家都熟悉的概念。但是,尽管这个概念广为人知,仍然有许多牌手在误用它。 1 基础知识

净胜率是什么意思?底池权益实现是什么意思? 净胜率是什么意思?底池权益实现是什么意思? 你可能已经多次听到“底池权益实现”,但如果你不知道底池权益实现的含义,或者如何使用底池权益实现,现

德州扑克高级打法:成牌转诈唬 德州扑克高级打法:成牌转诈唬 可能某些玩家习惯性手里没大牌时候进行诈唬,如果我们有最好的牌时对手弃牌,而对手将比我们有更好的牌时弃掉,也是我们

低级别牌手升级指南 低级别牌手升级指南 我有一个LLinusLLove的忠实粉丝,前段时间在沙龙里聊到这个天才少年。我也去关注了一些他的故事,其中很有意思的是他在

怎样在不利的位置诈唬下注 怎样在不利的位置诈唬下注 我们的对手的诈唬盈利越高,他需要去冒风险的资金就越多,而且/或者他得到的诈唬机会就越少。 我们之前发现,如果我们在所有

游戏口袋对子AA要避免的错误 游戏口袋对子AA要避免的错误 为了用你的AA榨取最大价值,你必须避免许多人们拿着这手强牌时常犯的代价昂贵的错误。在本文中,你将发现拿着口袋AA

输2个买入就上头?说明你资金管理没做好 作为一名德州扑克玩家, 你是否也有过连输两个买入就上头? 你是否也常常水上就打得浪,水下就打得紧? 如果常发生,说明你的Bankroll Manag

😘 🎢
📺 文章 📹
🎰 日誌 🎲
🎉 問答 🎹
🎬 遊戲APP 🎁
🎡 德扑初级入门 🎷
🥳 德扑高级养成 👀
🔥 德扑中级进阶 🎀
🎉 德州扑克 👄
😚 德州扑克趣闻 👀
😈 牌局分析 🎡