Jogue Poker Online e Ganhe Dinheiro Real.

WPT Global

纳什均衡 纳什均衡 喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO,即 GameTheory Optimal,翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗

纳什均衡

喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO,即 GameTheory Optimal,翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗口,通俗一点的解释可以是:在游戏中,你可以采取一种最优策略,使得自己的损失最小,同时游戏中的对手也必须采取相对应的策略,否则只会扩大你的受益。

讲到GTO,就不得不提到博弈论中非常著名的一个理论:纳什均衡(Nash Equilibrium)。该理论是由著名的经济学家,博弈论创始人,诺贝尔奖获得者约翰·纳什提出的,也就是电影《美丽心灵》的男主角原型。该理论是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。

约翰·纳什证明了在每个参与者都只有有限种策略选择,并允许混合策略的前提下,纳什均衡一定存在。上边的解释还是有点拗口,这里通过几个例子,更直观的理解一下这个理论。

什么是纳什平衡? 纳什均衡是博弈论最重要、最一般化的均衡概念。它是指所有参与人战略的这样一种组合:在这一组合中,给定其他参与人的战略,没有任何人有积极性改变自己的战略。换言之,构成纳什均衡的战略对每个人都是最优的。

纳什均衡有一个很重要的特点,即信念和选择之间的一致性。也就是说,基于信念的选择是合理的,同时支持这个选择的信念也是正确的。所以,纳什均衡具有预测的自我实现(self-enforcement)的特征:如果所有人都认为这个结果会出现,这个结果就真的会出现。(在博弈中的所有组合中,只有纳什均衡能满足自我实施的条件)

我们可以换一个角度来理解纳什均衡:假如在博弈之前,所有的参与人达成一个协议。我们的问题是:在不存在外部强制执行的情况下,每一个人是否有积极性去自觉遵守这个协议?如果每个人都有积极性遵守这个协议,这个协议就构成一个纳什均衡。也就是说,给定这个协议,别人遵守的情况下,没有人会有积极性选择不同于这个协议的行动,这个协议就是一个纳什均衡。反之,如果有任何人有积极性单方面背离这个协议,这个协议就不是一个纳什均衡。

从下面几个例子,可以看出纳什均衡是一个多么有力的分析工具。

囚犯的困境

假设有两个小偷A和B联手闯入民宅盗窃被抓,警方将两人置于不同的房间进行审讯,并给出如下政策:如果一个犯罪嫌疑人坦白并交出了赃物,两人都会被判有罪。如果另一个犯罪嫌疑人也坦白,则两人各被判刑8年;如果另一个犯罪嫌人抵赖,再加刑2年,而坦白者有功,会被立即释放。如果两人都抵赖,偷窃罪证据不足,但会因私入民宅而各判入狱1年。即:

表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。

此时有人会觉得双方都抵赖就好了,但问题是双方被隔离,都会怀疑对方会出卖自己以求自保。两个人都会这么想:假如对方坦白,此时如果我抵赖得坐10年监狱,如果我坦白才坐8年监狱;假如对方抵赖,此时如果我也抵赖会被判1年,如果我坦白可以被释放。综合以上考虑,不管对方坦白与否,对我而言都是坦白划算。此时最后的“纳什均衡”只能是两个人都坦白,共同被判8年刑期。

智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。但当小猪踩踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;大猪踩动了踏板,则有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半食物。

那么,两只猪各会采取什么策略?当然是小猪等在食槽边,而大猪不知疲倦地奔忙于踏板和食槽之间。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪不会去踩动踏板,自己亲自去踩踏板还有点吃的,总比不踩强,所以只好去踩踏板。

范式博弈

GOO公司和SAM公司存在利益关系,二者的收益会随着博弈的变化而不断更替。如下图:

双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的各自收益,每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。

现在我们站在GOO公司的角度来思考整个博弈策略。假如SAM选择合作,那么我方合作的收益是3,而我方背叛的收益是5,我方应该选择背叛;假如SAM选择背叛,那么我方合作的收益是 -3,而我方背叛的收益是-1,我方还是应该选择背叛。

同理,SAM公司也会做出相同的选择。最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。

但博弈的次数往往不止一次,当二家公司经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这个结果显然要好很多,因此二家公司在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。

但假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛而使我方遭受-3的损失,于是双方都会采取了背叛策略,最后的博弈结果又回到了(-1,-1)。

由此可见,随着次数的变化,博弈的性质也会发生变化,纳什均衡点会发生变化。

饿狮博弈

假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设A吃掉绵羊后就会打盹,这时比A稍弱的B就会趁机吃掉A,接着B也会打盹,然后比B稍弱的C就会吃掉B,以此类推。问:狮子A敢不敢吃绵羊?

该题须采用逆向分析法,从最弱的F开始分析,依次前推。假设E睡着了,F肯定会吃掉E,因为在F的后面已没有其它狮子了,不用担心自己被吃掉。继续前推,既然E知道自己睡着会被F吃掉,那么E必然不敢吃睡着了的D。既然E不敢吃掉D,那么D则可以放心去吃睡着的C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。

但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,如下图。这次的答案变成了狮子A敢吃掉绵羊。

对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性:当总数为奇数时,A敢吃;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。

硬币正反博弈

加入你和一个美女一起玩个数学游戏。美女提议:让我们各自亮出硬币的一面,如果我们都是正面,那么我给你3元;如果我们都是反面,我给你1元;剩下的情况你给我2元。那么你该不该和这位美女玩这个游戏呢?

这里需要讲一下纳什均衡的分类:

(1)纯战略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少。

(2)混合战略纳什均衡,是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略纳什均衡中要用概率计算,达到某一概率时,可以实现支付最优。因为概率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

在这个游戏中,应该采用混合策略纳什均衡。

假设我们出正面的概率是x,出反面的概率是1-x,美女出正面的概率是y,出反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,即:

3x + (-2)(1-x) = (-2) * x + 1*(1-x )

解方程得x=3/8;同样,美女的收益:

-3y + 2(1-y) = 2y+ (-1) * (1-y),

解方程同样得y等于3/8。于是,我们就可以算美女每次的期望收益是:

(1-y) * (2x-(1-x)) + y(-3x+2(1-x)) = 1/8元

即双方都采取最优策略的情况下,美女平均每次赢1/8元。所以当然不能和她玩这个游戏。其实只要美女采取了(3/8, 5/8)这个方案,不论你采用什么方案,都是不能改变局面的。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你会赔掉更多。

FAQ

请问如何下载WePoker客户端?

请问如何下载WePoker客户端?

请先透过"立即下载"按钮,注册后WePoker系统将会自动引导下载游戏。

WPK-微扑克 线上德州扑克优质俱乐部 FAQ

1. 什么是 WPK-微扑克 线上德州扑克优质俱乐部?

WPK-微扑克 是一个提供全级别德州扑克游戏的线上俱乐部,致力于为德扑爱好者打造一个优质的交流平台。

2. 如何加入 WPK-微扑克 俱乐部?

下载APP后,进入俱乐部需联系客服,未经客服允许的玩家无法进入俱乐部。

3. WPK-微扑克 提供哪些级别的游戏?

小级别:2/4

中级别:5/10

高级别:10/20

4. WPK-微扑克 的约局模式有什么特色?

作为国内线上扑克APP 约局模式的开拓者,微扑克支持自定义好友约局,方便玩家随时组局和提现。

5. WPK-微扑克 俱乐部的玩家交流如何进行?

玩家可以在俱乐部中与各路豪杰交流技艺,互相切磋,避免一个人打牌的无聊。

6. 是否有特别的奖励或红包活动?

玩家首次在俱乐部下桌,客服会提供鸿运红包。此外,推荐其他玩家也可以获得红包奖励,多推多得!

什么是 WPK-微扑克 全级别俱乐部德州?

什么是 WPK-微扑克 全级别俱乐部德州?

WPK-微扑克 全级别俱乐部德州是一个提供多种级别德州扑克游戏的平台,适合不同水平的玩家。如有其他问题,请随时访weipuke.org联系我们的客服。

如何在 WPT Global 使用 Skrill 存款?

如何在 WPT Global 使用 Skrill 存款?

要使用 Skrill 存款,您需要创建并验证一个账户。然后,您可以使用各种方法将资金添加到您的 Skrill 电子钱包。要在 WPT Global 存款,请登录您的玩家账户并前往收银台。点击“存款”并从可用选项中选择 Skrill。按照屏幕上的说明进行存款。

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

本網站僅收集相關文章。如需查看原文,請複製並打開以下連結:纳什均衡

🔥 🎨 H GAME日本遊戲分享平台 😘
WPT Global
WPT Global

WPT777


WPT Global
WPT Global

WPT777


WPT Global
WPT Global

WPT777


WPT Global
WPT Global

WPT777


WPT Global
WPT Global

WPT777


🎶 最新文章 🎗️ 🎰 熱門文章 😏
🎡 推薦文章 😉

德扑“听牌”的基本打法和成牌概率上篇 今天要解答的是粉丝“为你唱首歌”关于听牌打法的疑问。“听牌”是德扑中让人欢喜让人忧的情况,看上去充满希望,结局却不一定每次都能美梦成真。看完

德州扑克牌桌上的好位置会帮你赢得更多底池 德州扑克牌桌上的好位置会帮你赢得更多底池当你在德州扑克中决定是否游戏一手牌时,你的位置是一个最重要的考虑因素。为了给你自己最好的获胜机会,你

德州扑克胜率计算器 德州扑克胜率计算器 我们通常使用德州扑克胜率计算器来比较底牌在翻前和翻后的胜率。网络上有数百个像http://www.twodimes.net

深筹码打法的不同 深筹码打法的不同 许多人经常问我如何游戏深筹码扑克。深筹码一般是指200BB、300BB甚至更深的筹码量。这种筹码量现场牌手通常比较熟悉。深筹

好牌、棘手牌和垃圾牌的玩法 好牌、棘手牌和垃圾牌的玩法 当你拿到一手烂牌时,你会选弃牌,这种时候,你要考虑的东西不多,不过是判断是否值得拿它诈唬,是否有拿它做其他操作的必

要想打好德州扑克锦标赛,学会拥抱波动才能突破瓶颈 德州扑克锦标赛波动 作者简介 Gavin Griffin是一名职业的德州扑克玩家,此外,他也是第一位同时获得WSOP、WPT和EPT冠军头衔的玩家,目前为

德州扑克单挑技巧技术 德州扑克单挑技巧技术 如果你希望在无限德州单挑中获胜,你需要做出比对手更好的决定。因此,在德州扑克单挑中知道什么事情做,什么事情不该做就变得尤

扑克进阶:德州扑克的位置和起手牌 德州扑克的位置 首先叫注的位置是不利的,而后面的位置被认为是有利的。 越是后面的玩家越有利,因为可以在查看其他玩家的动作之后自己做判断。 在不完整

德州扑克起手牌概率 德州扑克起手牌概率 德州扑克游戏中每个玩家发两张手牌。第一张牌从52张牌中任选,第二张牌从余下51张牌中任选。 因为排列顺序在本游戏中没有意义,

起手牌88在翻前遭遇小筹码全压 起手牌88在翻前遭遇小筹码全压 牌局背景及过程 这手牌来自一场无限德州扑克锦标赛。桌上玩家筹码量如图。此时盲注1500/3000,前注75。翻前

德州扑克中针对超级松浪局的五个建议 德州扑克中针对超级松浪局的五个建议 你在德州扑克生涯中有时会碰到存在很多松浪玩家的牌局。我所说的松浪玩家不是指松凶玩家,而是指玩得很疯狂,又几

《激射萌娘》iOS掉签排除方法 亲爱的冒险者您好: iOS如遇到无法启动APP状况,再请依照下面步骤排除 1.请至平台官网重新下载 2.下载完成请至设置->通用->V

🎮 🎗️
🎗️ 文章 🎭
🎷 日誌 🎡
🎤 問答 😘
🎰 遊戲APP 🎧
🎗️ 德扑初级入门 😈
🎥 德扑高级养成 🌟
🔥 德扑中级进阶 🎗️
🎨 德州扑克 🎠
🎪 德州扑克趣闻 🎈
👀 牌局分析 🎲