概率補償——爲了遊戲體驗的巧妙設計

Intro——完全隨機的遊戲belike

讓我們構想一個情景：你正在玩一款類Dota遊戲，渡劫局，贏了這把就能升到最高段位。

這局遊戲中你是遠程大哥位，依仗暴擊的那種射手。經過線上的唯唯諾諾，矇頭苦刷，你通過裝備將自己的暴擊率提升到50%。

接下來是重要的資源團戰，你精緻走位，瘋狂平A，但是你逐漸發現不對，明明有50%的暴擊率，但是你就是A不出幾下暴擊，只能看着對面的戰士瘋狂打亂你們的團戰陣型。然後你輸掉團戰，節奏一塌糊塗，輸掉對局，渡劫失敗，被隊友沒收雙親，你憤而刪遊。

結束。

這就是沒有概率補償的類Dota遊戲中極大可能出現的情況，在某些關鍵的節點，隨機性並沒有那麼可靠，因爲隨機性真的太過隨機了。

面板數據隨機性的數學解讀

一枚完全質地均勻，六面質量相同的理想骰子，投擲一次得到每一面的幾率都是1/6，數學上稱之爲古典概型。試驗中所有可能出現的基本事件只有有限個，且試驗中每個基本事件出現的可能性相等。

那麼假設玩家此時暴擊率爲50%，作爲古典概型是否適合在遊戲中表達呢？

還是回到骰子，此時骰子就在你的手上，連續投出六次，奇了怪了，居然全是六點。你又投了六次，這次居然又全是三點。你感到疑惑。

不是說好的1/6嗎？

那麼這裏就要提到樣本容量。樣本容量是指一個樣本中所包含的單位數，你一共投了六次骰子，那麼樣本容量爲六次。樣本容量的大小與推斷估計的準確性有着直接的聯繫，在總體既定的情況下，樣本容量越大其統計估計量的代表性誤差就越小，反之,樣本容量越小其估計誤差也就越大。

圖源：https://www.cnblogs.com/yanFlyBlog/articles/14752635.html

六次是一個很小的樣本容量，所以你有很大的可能並不能得到1/6這個值。而當你連續投上一萬次，十萬次，更多次，那麼最終得到的數據將無限逼近1/6。

回到遊戲上，人們對於概率的第一感知是片面的，因爲樣本容量難以直觀感受。人們會自然地將視線關注到極端現象以及關鍵數據：比如連續沒有達成其中某一結果，或者關鍵團戰的概率結果。

舉個例子，假設你保持50%的暴擊率，在整局遊戲中平A了一萬次，最後統計，從總體來看，你暴擊的次數在五千次左右，沒有問題。可是你就是在關鍵團戰中，一次暴擊也沒A出來。就這樣，一段“合理“的極端情況毀掉了你一整局的遊戲體驗。

那有沒有辦法避免這樣的極端情況，同時儘可能保持暴擊率呢？

遊戲設計師：“有的兄弟，有的！”

☝️🤓

概率補償——爲了遊戲體驗的巧妙設計

《魔獸爭霸3》的設計師給出了“概率補償”這一天才設計：

還是面板50%的暴擊，這次我們這樣設定——實際上，你第一次的暴擊幾率並沒有50%，而是25.7%，如果這一次攻擊沒有暴擊，那麼下一次攻擊的暴擊幾率提升到51.4%，以此類推，在第四次攻擊時提升至100%。當產生暴擊，下一次攻擊的暴擊幾率再次回到25.7%。

我們來簡單通過馬爾可夫鏈的穩態概率計算一下，按照這樣設計的實際暴擊率是多少？

狀態0：初始狀態，暴擊概率爲25.7%（0.257）。

狀態1：前一次未暴擊，當前暴擊概率爲51.4%（0.514）。

狀態2：前兩次未暴擊，當前暴擊概率爲77.1%（0.771）。

狀態3：前三次未暴擊，第四次必定暴擊（100%）。

狀態0：暴擊後仍爲狀態0（概率0.257），未暴擊轉移到狀態1（概率0.743）。

狀態1：暴擊返回狀態0（概率0.514），未暴擊轉移到狀態2（概率0.486）。

狀態2：暴擊返回狀態0（概率0.771），未暴擊轉移到狀態3（概率0.229）。

狀態3：必定暴擊，返回狀態0（概率1）。

設穩態概率爲π₀（狀態0）、π₁（狀態1）、π₂（狀態2）、π₃（狀態3），滿足：

π₀ = 0.257π₀ + 0.514π₁ + 0.771π₂ + π₃

π₁ = 0.743π₀

π₂ = 0.486π₁

π₃ = 0.229π₂

π₀ + π₁ + π₂ + π₃ = 1

得到：

π₀ ≈ 0.4572, π₁ ≈ 0.3397, π₂ ≈ 0.1651, π₃ ≈ 0.0378

平均暴擊率爲各狀態暴擊概率的加權和：

{平均暴擊率} = 0.257π₀ + 0.514π₁ + 0.771π₂ + 1.0π₃ ≈ 45.74%

按照該機制，實際平均暴擊率約爲 45.7%。

概率補償的數學表達

與面板上的暴擊率存在一定的差距，但是通過概率補償，我們可以明顯看到它避免了極端數據的出現：降低第一次暴擊的概率，一定情況下避免了“刀刀烈火”的出現（所以S8的JackeyLove向前閃現的四下暴擊真是難得）；而同時增大後面攻擊的暴擊概率，避免了死活打不出暴擊的情況。

儘管實際的暴擊率低於面板上的，但是你的遊戲體驗得到了保障。

“嘰裏咕嚕說啥呢，我玩百爆的😋😋”

概率補償的應用不止於遊戲中的數值計算：抽卡，裝備強化，掉落機制等等機制中都能見其身影。

同時針對不同機制需求，概率補償得具體形式也有不同側重的分化：遞增型概率補償（剛纔已經提過），保底機制（Hard Pity，設置絕對上限，失敗次數達到閾值後強制成功），衰減型補償（反向調控，連續成功後降低概率，防止過度收益），動態平滑算法（如PRD僞隨機，通過數學公式（如馬爾可夫鏈）動態調整概率，使結果分佈更接近“人類直覺”），有機會我們再單獨討論。

從體驗上來說，玩家對“公平性”的感知比數學真實更重要（至理），人的感知有限，10%暴擊率若連續10次未暴擊，會被認爲“虛假”。“概率補償”通過巧妙的算法，實現了一定程度的“數學真實”與“玩家體驗”的平衡。讓隨機性更好地服務於遊戲。

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com