人工智能已经几乎征服了扑克


人工智能已经超越了掌握扑克的最后一个重要里程碑:六人无限制德州扑克 。
比起每个玩家都能看到整个局面的游戏 , 像扑克这样的具有隐藏卡和虚张声势的玩家的游戏 , 对AI的挑战更大 。在过去的几年中 , 计算机已经成为越来越复杂的一对一扑克形式的王牌 , 但是多人游戏将这种复杂性提升到了一个新水平(SN在线:5/13/15) 。
研究人员在7月11日的《科学》网上报道说 , 如今 , 一个被称为Pluribus的纸牌鲨AI在六人制德州扑克比赛中胜过了十几位精英专业人士 。可以使用此类参差不齐的信息针对多个对手进行密谋的算法可能会使精明的业务谈判人员 , 政治策略师或网络安全监督者成为现实 。
Pluribus通过与自己的副本进行对抗来磨练其初始策略 , 从头开始 , 逐步了解哪些行动有助于赢得胜利 。然后 , AI在每个手对五位人类玩家的第一轮下注中使用该直觉来确定何时握住和何时折叠 。
在随后的下注回合中 , Pluribus想象了如果采取不同的动作游戏会如何进行 , 从而对其策略进行了微调 。与为两人扑克训练的人工智能不同 , Pluribus并没有完全推测到游戏结束–与如此多的玩家打交道时 , 这将需要太多的计算(SN:4/1/17 , 第12页)。取而代之的是 , AI设想了一些前进的步伐 , 并根据那些假设的未来和玩家可以采用的不同策略来决定要做什么 。
在10,000张德州扑克比赛中 , Pluribus与来自13位专业人员的五名选手竞争 , 他们全部赢得了超过100万美元的扑克游戏 。每100手牌中 , Pluribus平均从其人类竞争对手中赢利480美元 。
【人工智能已经几乎征服了扑克】纽约市Facebook AI Research的诺姆·布朗(Noam Brown)说:“这大约是精英人类专业人士所希望击败的弱者 , ”这意味着Pluribus比其人类对手更聪明 。布朗与匹兹堡卡内基梅隆大学的托马斯·桑德霍尔姆共同创建了普里布斯 。
布拉格捷克技术大学的计算机科学家ViliamLisy表示 , 既然现在AI已经掌握了扑克 , 算法就可以在游戏中使用更复杂的隐藏信息来测试其战略推理 , 他没有参与这项工作 。Lisy说 , 在像Kriegspiel这样的游戏中(象棋副产品 , 玩家看不到彼此的棋子) , 未知数会比在对手胸前紧握几张纸牌复杂得多 。

    推荐阅读