策略+教学/分析工具=强大的扑克AI

Nikolai Yakovenko(尼古拉 雅克文科) 是一位AI学者、深度学习研究员。同时也是一名德扑牌手。在过去的十多年里,他和全球其他专注于AI人工智能的专家们一样,利用扑克牌局来寻找AI研究的探索方向。
扑克游戏处于完美信息的对立面,扑克游戏并不存在什么完美制胜的战略。毕竟其他玩家的下一步是难以预测的。所以无论是基于概率还是博弈论方向的研究学者,都沉迷于将复杂的扑克牌局计算作为展开AI实验和训练的重要途径。

在一次麻省理工大学的公开演讲中,尼古拉分享了自己对人工智能与扑克之间的一些观点与预测。

五年,扑克AI就将抵达锦标赛现场

尼古拉认为,五年、甚至要不了五年,扑克机器人就将抵达大型扑克锦标赛的现场,与真实玩家们形成竞争。尼古拉认为,扑克机器人并不一定需要掌握真实玩家的风格。毕竟,在真人扑克牌局中,正常的职业选手或多或少都能赢得一些赛事的奖金。甚至,一个技术水平低于平均水平的玩家,偶尔都能赢。所以在任何扑克赛事的早期阶段,经过大量数据训练的扑克机器人能够对抗一些可预测的牌局。

但尼古拉并不认为扑克机器人在赛场上具有压倒性的竞争力,指望利用扑克机器人赢取赛事的百万奖金,基本不太靠谱。

策略+教学/分析工具=现阶段强大的扑克AI

尼古拉认为,扑克机器人更大的价值将体现在辅助工具的作用上。目前,强大的扑克AI最直接的价值是作为教学/分析工具。在尼古拉的观点中,这是研究扑克AI的两大重要出路之一。

以被称为德扑届的「阿尔法狗」——Libratus为例。Libratus在初次亮相时,透过一对一扑克牌局中击败数名职业选手。然而这是AI「策略」的胜利。研究人员为Libratus设定了一组损失最少的策略,让Libratus的每次出牌都按照扑克玩法每一手牌的最大概率进行。这样能够避免不输,但是也不一定能赢。追求不输,争取平局是Libratus的第一目标。即使获胜,在千变万化的扑克牌局组合中也只能实现侥幸小胜,真人并不会一败涂地。

按照Libratus幕后的行业扛鼎专家Noam Brown(诺曼 布朗)和他团队的学术研究计划,距离能够处理真实赛事中多人对局的超级复杂局面,Libratus要走的路还非常漫长。在目前的计划中,Noam Brown团队期待通过大数据分析和深度学习,为Libratus找到一套基于博弈论的通用策略,用来与不同风格的扑克选手对抗。

人类会为扑克AI提供更有价值的用途

尼古拉还表示,平衡求解(CFR/equilibrium solving)能够适用于六人无限制德州扑克玩法。他建议正在这条道路上奔跑的研究人员们,尝试利用平衡求解输出训练扑克牌局。

尼古拉坚信,人类会为扑克AI提供更有价值的用途,而不仅仅作为一种训练工具。他非常期待在周末夜晚的俱乐部里,有八部AI能够快乐地玩起真实的扑克牌局,并且每个AI都独一无二,与众不同。

此文整合转载于Nikolai Yakovenko的个人博客及Noam Brown的个人twitter,代表研究人员的个人意见,并不代表AIPoker的官方观点。

编译出处:
https://medium.com/@Moscow25/