德州撲克博弈論
作者:棋牌秀     2019-08-07 11:06:43


   撲克和石頭剪刀布游戲,以及經濟學活動等一切博弈一樣,是人與人之間的決策博弈,假設參與博弈的所有人都是完完全全理性的,那么整個博弈就存在最優解,這個最優解叫GTo(Game Theory optimal,博弈最優解)。

    4.1撲克的博弈論

    所調GT0就相當于玩石頭剪刀布的兩個玩家都是絕頂高手,為了不讓對手找到漏洞,采取理想的無漏洞打法,也就是33.3%的石頭、33.3%的剪刀、33.3%的布。同理,撲克中的GTO打法,和石頭剪刀布游戲里各1/3的策略一樣,都是無漏洞策略,雖然無法被對手找到弱點,但是也無法贏對手,屬于最佳防守策略。截止到2017年,全球的人工智能在德州撲克領域也一直按照撲克GTO策略制作機器人,2017年來自卡內基梅隆大學的目前世界第一德州撲克人工智 MELibratus能,已經在少量手牌交戰中戰勝了4位人類高手。之所以能贏人類高手,也是因為短期的波動比較大,人工智能剛好短期走運而已,當然 LIBratus的GTO策略只能保證不輸,類似于石頭剪刀布各1/3的GT0策略。

    下面我們通過計算石頭剪刀布游戲的GTO策略,來直觀地看看GT0策略的=4.1.1GTO策略的特征。

    在石頭剪刀布中要想贏對手,就必須看到對手策略中的漏洞,我們采取偏離GTO策略的克制對手策略來盈利。

    例如,一個玩家采取GTO策略(石頭剪刀布各1/)和我們玩石頭剪刀布游戲,我們是無法獲利的。

    (1)如果我們改變策略,36%出石頭、32出剪刀、32%出布,下注量為100,對手策略不變,情況如下:

    我們36%的概率出石頭的時候,對手有13的概率出石頭,平局;1/3的概率出剪刀,我們贏100;1/3的概率出布,我們輸100。
    我們32%的概率出剪刀的時候,對手有1/3的概率出石頭,我們輸100;1/3的概率出剪刀,平局:1/3的概率出布,我們贏100。
    我們32%的概率出布的時候,對手有1/3的概率出石頭,我們贏1001/3的概率出剪刀,我們輸100;1/3的概率出布,平局。

    可以發現,我們和對手都沒有盈利。

    無論我們怎么調整策略,“石頭:剪刀:=32:36:32”也好,“石頭:剪刀:布=32:32:36也好,甚至“石頭:剪刀布=100:0:0”,我們最終的盈利都為0,也就是說當對手采取GTO策略的時候,我們是無法獲利的,當然對手也無法獲利。

更多游戲請關注棋牌游戲導航網,棋牌游戲大全,在線玩棋牌游戲。



評論(0

我要評論


上一篇:沒有上一篇了!