從騙子酒館談博弈論

今下午玩同學庫裏的騙子酒館,被豬哥狠狠薄紗了,本科期間修過一門博弈論的選修課,感覺很有意思,來分析一下騙子酒館裏的撲克牌模式的有趣之處。

豬哥別開我了

博弈論,又稱爲對策論(Game Theory)、賽局理論等,既是現代數學的一個新分支,也是運籌學的一個重要學科。

博弈論主要包括以下要素:

1.局中人:在一場競賽或博弈中,每一個有決策權的參與者成爲一個局中人。只有兩個局中人的博弈現象稱爲“兩人博弈”,而多於兩個局中人的博弈稱爲“多人博弈”。

2.策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱爲這個局中人的一個策略。如果在一局博弈中局中人都總共有有限個策略,則稱爲“有限博弈”,否則稱爲“無限博弈”。

3.得失:一局博弈結局時的結果稱爲得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函數,通常稱爲支付(payoff)函數。

4.結果:對於博弈參與者來說,存在着一博弈結果 。

對於騙子酒館,局中人即各位玩家,策略即面對上家和其他玩家選擇的不同牌型,選擇出牌或是挑戰,得失和結果就是是否能使對方開槍還是自己開槍。

博弈論也有一些很有意思的情景:

1.納什均衡

納什平衡指,在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。

一個很出名的例子就是“囚徒困境”。即警方抓住兩個小偷,將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。

如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

在這個囚徒困境中,“互相背叛” 是一種納什均衡。當 A 選擇背叛時,B 的最優策略是背叛;當 B 選擇背叛時,A 的最優策略也是背叛。雙方都選擇背叛就是這個博弈的納什均衡點,即使這個結果對他們整體來說是最糟糕的,但在個體理性的驅動下,他們很難擺脫這種困境。

2.零和博弈:

零和博弈是指參與博弈的各方,在嚴格競爭下,一方的收益必然意味着另一方的損失,博弈各方的收益和損失相加總和永遠爲 “零”。也就是說,在零和博弈中,參與者的利益是完全對立的,不存在合作產生雙贏的可能。

顯然,騙子酒館中的博弈都是零和博弈,有贏家就有輸家,沒有共同勝利的情況。

從都獲得快樂的角度,也算非零和博弈吧

那麼我們簡單定性分析一下騙子酒館的撲克牌模式,即玩家輪流出牌並聲明牌面數值(AKQ),這個數值必須和桌面上的要求匹配,玩家出牌時可能會對牌面數值撒謊,其他玩家若懷疑其撒謊,可以揭穿,如果有人被揭穿且確實撒謊,就必須拿起桌子前面的左輪進行一輪俄羅斯轉盤,槍裏只有一發子彈,活下來則可以繼續遊戲,失敗則意味着遊戲結束,轉盤結束後,牌局重置繼續。

策略空間

  1. 誠實出牌並聲明正確數值:玩家選擇按照實際牌面出牌並如實聲明牌面數值(A、K、Q)。這種策略的優點是如果其他玩家不懷疑,遊戲可以平穩進行,且沒有生命危險;缺點是可能在某些情況下無法滿足桌面要求,從而失去出牌機會。

  2. 撒謊出牌並聲明虛假數值:玩家選擇打出一張牌但聲明與實際牌面不符的數值。這種策略可能會讓玩家在當前局面下獲得出牌機會,滿足桌面要求從而獲得優勢,但如果被其他玩家揭穿,將面臨俄羅斯轉盤的風險

收益分析

  1. 誠實出牌的收益:

    • 如果其他玩家也誠實出牌,遊戲平穩進行,玩家可能會在後續的遊戲中逐步積累優勢,獲得最終勝利的機會。但這種收益相對較爲緩慢和不確定,取決於遊戲的整體進程和其他玩家的表現。

    • 如果其他玩家撒謊且未被揭穿,誠實出牌的玩家可能在當前局面處於劣勢。

  2. 撒謊出牌的收益:

    • 如果成功騙過其他玩家且未被揭穿,玩家可以迅速獲得出牌優勢,滿足桌面要求,可能在當前局面獲得較大的利益,增加自己最終獲勝的概率。

    • 如果被揭穿並進行俄羅斯轉盤,面臨風險。如果沒有被揭穿或者俄羅斯輪盤沒有A④自己,可以繼續遊戲,但心理壓力會極大增加;如果失敗,則遊戲結束,收益爲負無窮

具體的博弈論分析因爲我太菜了,只能分析幾種極端的簡單的情況

1.純策略納什均衡分析

全誠實策略組合:如果所有玩家都選擇始終誠實出牌和聲明真實牌面數值(開麥),這可以構成一個納什均衡。因爲在這種情況下,每個玩家都沒有動機去單方面改變策略。如果一個玩家開始撒謊,他將面臨被揭穿和俄羅斯轉盤的風險,而只要其他玩家都保持誠實,這個玩家通過誠實策略能夠穩定地參與遊戲,沒有動力去冒險撒謊。

全撒謊策略組合(理論上):從理論上來說,所有玩家都選擇撒謊並且從不揭穿對方也可能構成一個納什均衡。但在實際遊戲中,這種情況很難成立,因爲玩家之間很難達成這樣的默契。而且一旦有玩家開始懷疑並揭穿,這個均衡就會被打破。因爲被揭穿的玩家爲了自身利益,很可能會反過來揭穿其他玩家,導致大家都面臨風險。

2.混合策略納什均衡分析

假設玩家有兩種策略:誠實(H)和撒謊(L)。設玩家1選擇誠實的概率爲p,撒謊的概率爲1 - p;玩家2(假設只有兩個玩家的簡化情況)選擇誠實的概率爲q,撒謊的概率爲1 - q。

玩家1的期望收益函數可以定義爲:

對於玩家2也有類似的期望收益函數。通過對收益函數求導並令其等於零,可以找到混合策略納什均衡的概率值。在這個博弈中,這些收益值會受到被揭穿的概率、俄羅斯轉盤的死亡率以及遊戲勝利的潛在收益等因素的影響。

例如,被揭穿的概率越高,玩家會更傾向於選擇誠實策略,因爲撒謊的風險太大。而如果遊戲勝利的潛在收益很高,相對於俄羅斯轉盤的風險,玩家可能會更傾向於增加撒謊的概率。

3.考慮貝葉斯法則

在這個博弈中,玩家對於其他玩家手中的牌以及其他玩家是否會撒謊是不完全信息的。玩家只能根據其他玩家的出牌行爲、表情(比如豬哥瘋狂點頭)等線索來推測對方是否在撒謊。

假設玩家 i 認爲玩家 j 撒謊的先驗概率爲n。當玩家 j 出牌並聲明牌面數值時,玩家 i 會根據這個聲明和自己對牌面分佈的信息來更新自己的信念(“信念” 是博弈論中指玩家對其他玩家是否誠實的主觀判斷概率)。如果玩家 j 的聲明與玩家 i 預期的牌面分佈差異很大,那麼玩家 i 會根據貝葉斯法則更新n,使其更傾向於認爲玩家 j 在撒謊。

例如,如果桌面上已經出現了很多 A 牌,而玩家 j 聲稱又出了一張 A,玩家 i 可能會提高自己對玩家 j 撒謊的概率估計。然後玩家 i 會根據這個更新後的概率來決定是否揭穿玩家 j,這個決策過程也是一個基於貝葉斯法則的期望收益計算過程。

其他的情況還有很多,大家玩遊戲的時候應該也總結了很多小妙招,希望都可以分享一下

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com