从骗子酒馆谈博弈论

今下午玩同学库里的骗子酒馆,被猪哥狠狠薄纱了,本科期间修过一门博弈论的选修课,感觉很有意思,来分析一下骗子酒馆里的扑克牌模式的有趣之处。

猪哥别开我了

博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要包括以下要素:

1.局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

2.策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一局博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

3.得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

4.结果:对于博弈参与者来说,存在着一博弈结果 。

对于骗子酒馆,局中人即各位玩家,策略即面对上家和其他玩家选择的不同牌型,选择出牌或是挑战,得失和结果就是是否能使对方开枪还是自己开枪。

博弈论也有一些很有意思的情景:

1.纳什均衡

纳什平衡指,在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

一个很出名的例子就是“囚徒困境”。即警方抓住两个小偷,将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

在这个囚徒困境中,“互相背叛” 是一种纳什均衡。当 A 选择背叛时,B 的最优策略是背叛;当 B 选择背叛时,A 的最优策略也是背叛。双方都选择背叛就是这个博弈的纳什均衡点,即使这个结果对他们整体来说是最糟糕的,但在个体理性的驱动下,他们很难摆脱这种困境。

2.零和博弈:

零和博弈是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为 “零”。也就是说,在零和博弈中,参与者的利益是完全对立的,不存在合作产生双赢的可能。

显然,骗子酒馆中的博弈都是零和博弈,有赢家就有输家,没有共同胜利的情况。

从都获得快乐的角度,也算非零和博弈吧

那么我们简单定性分析一下骗子酒馆的扑克牌模式,即玩家轮流出牌并声明牌面数值(AKQ),这个数值必须和桌面上的要求匹配,玩家出牌时可能会对牌面数值撒谎,其他玩家若怀疑其撒谎,可以揭穿,如果有人被揭穿且确实撒谎,就必须拿起桌子前面的左轮进行一轮俄罗斯转盘,枪里只有一发子弹,活下来则可以继续游戏,失败则意味着游戏结束,转盘结束后,牌局重置继续。

策略空间

  1. 诚实出牌并声明正确数值:玩家选择按照实际牌面出牌并如实声明牌面数值(A、K、Q)。这种策略的优点是如果其他玩家不怀疑,游戏可以平稳进行,且没有生命危险;缺点是可能在某些情况下无法满足桌面要求,从而失去出牌机会。

  2. 撒谎出牌并声明虚假数值:玩家选择打出一张牌但声明与实际牌面不符的数值。这种策略可能会让玩家在当前局面下获得出牌机会,满足桌面要求从而获得优势,但如果被其他玩家揭穿,将面临俄罗斯转盘的风险

收益分析

  1. 诚实出牌的收益:

    • 如果其他玩家也诚实出牌,游戏平稳进行,玩家可能会在后续的游戏中逐步积累优势,获得最终胜利的机会。但这种收益相对较为缓慢和不确定,取决于游戏的整体进程和其他玩家的表现。

    • 如果其他玩家撒谎且未被揭穿,诚实出牌的玩家可能在当前局面处于劣势。

  2. 撒谎出牌的收益:

    • 如果成功骗过其他玩家且未被揭穿,玩家可以迅速获得出牌优势,满足桌面要求,可能在当前局面获得较大的利益,增加自己最终获胜的概率。

    • 如果被揭穿并进行俄罗斯转盘,面临风险。如果没有被揭穿或者俄罗斯轮盘没有A④自己,可以继续游戏,但心理压力会极大增加;如果失败,则游戏结束,收益为负无穷

具体的博弈论分析因为我太菜了,只能分析几种极端的简单的情况

1.纯策略纳什均衡分析

全诚实策略组合:如果所有玩家都选择始终诚实出牌和声明真实牌面数值(开麦),这可以构成一个纳什均衡。因为在这种情况下,每个玩家都没有动机去单方面改变策略。如果一个玩家开始撒谎,他将面临被揭穿和俄罗斯转盘的风险,而只要其他玩家都保持诚实,这个玩家通过诚实策略能够稳定地参与游戏,没有动力去冒险撒谎。

全撒谎策略组合(理论上):从理论上来说,所有玩家都选择撒谎并且从不揭穿对方也可能构成一个纳什均衡。但在实际游戏中,这种情况很难成立,因为玩家之间很难达成这样的默契。而且一旦有玩家开始怀疑并揭穿,这个均衡就会被打破。因为被揭穿的玩家为了自身利益,很可能会反过来揭穿其他玩家,导致大家都面临风险。

2.混合策略纳什均衡分析

假设玩家有两种策略:诚实(H)和撒谎(L)。设玩家1选择诚实的概率为p,撒谎的概率为1 - p;玩家2(假设只有两个玩家的简化情况)选择诚实的概率为q,撒谎的概率为1 - q。

玩家1的期望收益函数可以定义为:

对于玩家2也有类似的期望收益函数。通过对收益函数求导并令其等于零,可以找到混合策略纳什均衡的概率值。在这个博弈中,这些收益值会受到被揭穿的概率、俄罗斯转盘的死亡率以及游戏胜利的潜在收益等因素的影响。

例如,被揭穿的概率越高,玩家会更倾向于选择诚实策略,因为撒谎的风险太大。而如果游戏胜利的潜在收益很高,相对于俄罗斯转盘的风险,玩家可能会更倾向于增加撒谎的概率。

3.考虑贝叶斯法则

在这个博弈中,玩家对于其他玩家手中的牌以及其他玩家是否会撒谎是不完全信息的。玩家只能根据其他玩家的出牌行为、表情(比如猪哥疯狂点头)等线索来推测对方是否在撒谎。

假设玩家 i 认为玩家 j 撒谎的先验概率为n。当玩家 j 出牌并声明牌面数值时,玩家 i 会根据这个声明和自己对牌面分布的信息来更新自己的信念(“信念” 是博弈论中指玩家对其他玩家是否诚实的主观判断概率)。如果玩家 j 的声明与玩家 i 预期的牌面分布差异很大,那么玩家 i 会根据贝叶斯法则更新n,使其更倾向于认为玩家 j 在撒谎。

例如,如果桌面上已经出现了很多 A 牌,而玩家 j 声称又出了一张 A,玩家 i 可能会提高自己对玩家 j 撒谎的概率估计。然后玩家 i 会根据这个更新后的概率来决定是否揭穿玩家 j,这个决策过程也是一个基于贝叶斯法则的期望收益计算过程。

其他的情况还有很多,大家玩游戏的时候应该也总结了很多小妙招,希望都可以分享一下

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com