Play Poker Online and Win Real Money.

WPT Global

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

WPK-微扑克 俱乐部提供哪些级别的游戏?

WPK-微扑克 俱乐部提供哪些级别的游戏?

小级别:1/2 到 3/6

中级别:5/10 到 10/20

高级别:20/40

如有其他问题,请随时访weipuke.org联系我们的客服。

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

您只需要先卸载已安装的APP,重新安装即可解决。

WePoker注册时的国旗要怎么选择?

WePoker注册时的国旗要怎么选择?

此部份默认即可,显示的国旗并不影响您的游戏进行。

WPT Global 支持的其他电子钱包

WPT Global 支持的其他电子钱包

除了 Neteller,WPT Global 还支持多种其他电子钱包进行存款和取款:

  • Skrill
  • ecoPayz
  • MuchBetter
  • Astropay
  • Luxon Pay

要使用这些电子钱包之一进行存款,请登录您的 WPT Global 账户,前往收银台并选择相应的电子钱包选项。输入所需金额并按照提示完成存款流程。电子钱包存款通常会立即到账,让您可以立即开始游戏。需要注意的是,可用的具体电子钱包选项可能因您所在的地区而有所不同。建议您登录 WPT Global 并查看当前可用的支付方式。

WPK-微扑克 是否有代理合作机会?

WPK-微扑克 是否有代理合作机会?

是的,我们是官方渠道,WPK-微扑克 俱乐部欢迎全球德州玩家合作代理,并提供返佣政策。如有其他问题,请随时访weipuke.org联系我们的客服。

本網站僅收集相關文章。如需查看原文,請複製並打開以下連結:打了一辈子德州,居然输给了新手AI!(中篇)

🎻 最新文章 🎀 🎉 熱門文章 🎳
🔥 推薦文章 🎢

德州扑克赔率到底是什么?算出赔率有什么用? 德州扑克赔率到底是什么?算出赔率有什么用? 想打好德扑,就一定要对彩池、彩池的变化、彩池和筹码之间的比例关系有一定的了解,这样才能选择对我们最

世界级德州扑克牌手的思维模式 世界级德州扑克牌手的思维模式 最近听了一个转行做加密货币投资的前世界级德州扑克牌手的podcast,他提到近几年来因为行业环境不好的原因,很多

翻前弃牌的学问 翻前弃牌的学问 我们先来解释一下德州扑克中最重要、但是最不刺激的打法:翻前弃牌。 你在翻牌圈之前就选择了弃牌,所以你只能看到自己的两张底牌。在你

中等同花连张的打法策略 中等同花连张的打法策略 大多数牌手对于87s这种漂亮的中等同花连张有一种特别的偏爱。但是,因为光鲜的外表,它们成为了无限德州扑克中最容易打错的

德州扑克VPIP 德州扑克VPIP 概念:VPIP是德州扑克数据软件(holdem manager2)里给出的第一个也是最重要的数据,它的英语全称是 Voluntarily Put $ In Pot

德扑发展历史 德扑是一款非常火爆的纸牌游戏,那么德扑的历史与发展是什么呢?相信大家对这个问题很感兴趣,下面给大家介绍一下,希望可以帮助到大家。 一、20世纪

什么是最好的下注尺度 什么是最好的下注尺度 玩家在德州扑克比赛中的输赢一大决定因素就是下注尺度,而这也是区分业余牌手和职业牌手的一大核心标准。在一天的比赛结束之后,

德州扑克中的数学——贝叶斯与归纳演绎 德州扑克中的数学——贝叶斯与归纳演绎 开始打牌之前还有一位大神需要知道,这位兄台生前的理论奠定了概率论的基础,将统计学与概率论联系在了一起,甚

如何在德州扑克牌桌上保持专注? 写在前面的话:前几周写了打牌前的热身方法,很多朋友反馈说对提高专注力这一部分很感兴趣。其实这也是我自己最近感触非常深的一个话题。所以这一周我

在线德州扑克的技巧和窍门 在线德州扑克的技巧和窍门 要成为一名优秀的德州扑克玩家需要付出很多努力。如果你想成为一名职业玩家,其努力程度堪比完成一个大学学位。但是,你不需

范围平衡/扑克组合 范围平衡/扑克组合 扑克组合是数学的一个分支,通过量化扑克中各种情况下的手牌组合,它可以帮助我们来确定对手的范围。举一个明显的例子吧,假设你知

德州扑克最全的玩法解释 德州扑克最全的玩法解释 本文读完需要3分钟 速读仅需2分钟 德州扑克采用52张扑克牌(除去两张王牌),游戏玩家人数限制在2~9人。在牌局开始时,荷

😚 🌟
🎸 文章 🎼
🎳 日誌 🎢
🎬 問答 😉
🎮 遊戲APP 😉
📺 德扑初级入门 🎮
📹 德扑高级养成 🎁
💋 德扑中级进阶 🎸
🎧 德州扑克 🎊
💋 德州扑克趣闻 🎡
👄 牌局分析 🎲