計算機撲克研究小組的研究人員首次破解雙人限注撲克的決勝法門


計算機撲克研究小組的研究人員首次破解雙人限注撲克的決勝法門

計算機撲克研究小組的研究人員首次破解雙人限注撲克的決勝法門
(報道)據鳳凰科技(編譯/嚴炎劉星):科學日報報道,在過去的半個多世紀,游戲一直是人工智能(AI)領域新想法的實驗臺 , 產生的成功都標記著意義重大的里程碑——超級國際象棋電腦“深藍”擊敗國際象棋大師加里•卡斯帕羅夫(Garry Kasparo)以及超級計算機沃森擊敗了危險邊緣節目前冠軍肯•詹寧斯(Ken Jennings)和布拉德•魯特(Brad Rutter) 。然而 , 打敗頂級人類選手和實際破解一個游戲并非同一回事,而現在加拿大亞伯達大學科學學院計算機撲克研究小組( Computer Poker Research Group,簡稱CPRG )的研究人員首次破解雙人限注撲克(heads-up limit hold'em poker)的決勝法門 。
“撲克一直是過去40多年人工智能面臨的一項頗具挑戰性的問題,而這個問題到此結束 ?!毖芯渴紫髡?、科學學院的鮑靈(Bowling)這樣說道 。這項研究發表在1月9日的期刊《科學》上 。撲克是具有不完整信息的游戲集合,玩家對過去事件并不具備完全的知識 ?,F在最流行的撲克類型是德克薩斯撲克 。當它只有兩名玩家(一對一的兩家對戰)且只有固定的押注和次數時,這就被稱為雙人單挑限注撲克 。由于比西洋棋更?。訟拮⑵絲瞬煌暾畔⒌謀局實賈濾晌縋醞婊蛘咝枰餼齙囊桓齦刑粽叫緣撓蝸?。
“如果當無止境的玩牌與以95%的置信程度上破解這副撲克牌之間不存在統計學角度的差異,那么我們就將這個游戲定義為可以破解的 ?!?鮑靈解釋道 ?!跋胂笠幌乱粋€人一小時玩200次牌 , 一天玩12小時不間斷需要連續玩70年 。再想象一下更糟糕的情形,最大化的精神掠奪,對手的策略以及從來都不能犯一個錯誤 ?!?br /> 【計算機撲克研究小組的研究人員首次破解雙人限注撲克的決勝法門】雖然很多完整信息游戲(也就是玩家在做決策之前被告知在游戲中可能發生的一切)被破解,例如四子棋,沒有一個由人類玩家玩的重要的非完整信息游戲被破解過 。這些游戲更具挑戰性 。雖然完整信息游戲可能是大眾客廳游戲里的不可缺少的一部分,它卻在真實世界的決策設定里非常罕見 。
“這項結果背后的突破性進展是一般算法的進步,它使得任何類型的大規模模型里的博弈推理變得更易駕馭 ?!?鮑靈解釋道 。雖然看起來有趣,但博弈論一直被認為具有重要的啟示意義,包括涉及安全的博弈應用,例如在機場安檢地區、空中武警時間安排和海岸警衛隊巡邏部署的系統 。真實世界的決策設定幾乎總會涉及不確定性和信息缺失 , 高計算法,例如破解撲克所需要的算法 , 可以用于推動未來的應用 。