扑克AI能否赢得WSOP主赛事?

科学家总是热衷于让AI跟人类下棋,玩牌。涉及面从简单的五子棋,到复杂的围棋和德州扑克。一方面是因为这些项目自古以来就被认为是人类智力活动的象征。模拟人类活动的AI自然要以此为目标,可以吸引更多人关注并投身于人工智能的研究和应用中来。另一方面,棋类也很适合作为新的AI算法的标杆。

 

棋牌类游戏,虽然在大众眼中都属于智力游戏,但是在科学家面前,“棋”和“牌”是完全不同的项目。棋类属于完全信息博弈,而牌类则属于非完全信息博弈。

完全信息博弈顾名思义,即棋面信息博弈双方接收是完全对等的。此类博弈中,AI每次只需要根据当前盘面,搜索计算各种情况下自己的胜率。为了提高搜索效率,一般需要对搜索过程中产生的“博弈树”进行广度和深度剪枝。也就是说的算多远和算多准。为了算得远,一般需要让AI少看对手和自己不太可能走的地方,称之为策略函数。为了算的准,需要更加准确地评估多步后盘面自己的胜率,称之为价值函数。找到了合适的函数,再加上计算机的强大计算力,这就让AI达到或超过人类成为可能。

五子棋的空间复杂度较低。甚至在不需要对博弈树剪枝的情况下,计算机凭借强大的计算能力便可以计算所有盘面的可能。所以在这种相对简单的棋类游戏中,人类已经不存在战胜AI的可能。而围棋的空间复杂度高,据估计围棋的决策点大概有10的170次方之多。找到合适的策略和价值函数一直是围棋AI的核心问题。蒙特卡洛树搜索算法用概率的方法帮助围棋AI找到了一个较为准确的价值函数,而借助深度神经网络,则寻找到了更好的策略和价值函数的计算方法。AI还可以无限模拟各种对弈情境,生成上亿数据,用来训练生成更准确的函数。这也是集大成的 “AlphaGo”能在2016年以4:1历史性战胜了世界顶级围棋棋手李世石的原因。

可如果对战双方得到的信息是不完全、不对等的,就属于非完全信息类,如德州扑克。非完全信息博弈要求更为复杂的推理能力,不仅要看别人打了什么牌,还要猜测别人手里有什么牌,并根据对手行动暗示出的信息,来计算自己的最优出牌出法。由于对手的行为不仅暗示他的信息,也取决于他对我们的私人信息有多少了解,我们的行为透露了多少信息。所以,这种“循环推理”,导致很难孤立地推理出游戏的状态。

德州扑克的搜索复杂度是10的160次方,和围棋接近。博弈中主要采用“纳什均衡”原理——在一个特定时刻,寻找相对于其他参与人的最优反应。扑克不仅要根据不完全信息进行复杂决策,还要应付对手的虚张声势、故意示弱等招数。去年年底,来自阿尔伯塔大学、查尔斯大学和布拉格捷克理工大学的计算机科学家开发的 DeepStack在二人无限注德州扑克中打败了人类职业玩家;今年年初,卡内基∙梅隆大学所开发的 Libratus 又击败了四个更加优秀的职业选手,这是AI 在不完全信息博弈中堪称里程碑式的突破。

在最近的斯隆体育分析会议上,扑克玩家和游戏理论家Nikolay Yakovenko谈到了有朝一日扑克机器人成为WSOP冠军的可能性。这主要是因为由Carnegie Melon的研究人员创建的Libratus程序在数千场单挑中战胜了世界上最好的职业牌手,从而证明了在扑克单挑领域里,人类已经完败给机器。人类牌手们在失去扑克单挑领域的地盘后,紧接着牌手们都关心的下一个问题就是“有一天计算机程序有可能在6人或9人的游戏中做的比人类玩家更好吗?”

目前科学家们也坦承扑克AI暂时还不能胜任多人的无限制扑克比赛,但来自Alberta和Carnegie Mellon的科学家十分愿意尝试修改它可以提升到6-max桌的比赛中。虽然这个任务会变得更艰巨,但他们认为这一切在五年后会有改变,甚至给出了计划表:

第一年 – AI可以在六人比赛桌同人类玩家抗衡并得心应手。
第二年 – 深度学习系统使AI无需在线进行大量计算,这会节约大量的时间让AI正常参赛成为可能。
第三年 – 人工智能发挥作用,可以根据统计数据创建不同的策略以适应更多的变化。
第四年 – 扑克AI进攻线上扑克领域,可以在线上与真实玩家进行即时的互动。
第五年 – 调整和进一步改进,AI可以处理扑克领域的任何问题,甚至可能会在WSOP赛事中夺冠。

如果这一天真的实现,从社会层面的反馈看,有人会顾虑,机器对弈人类获得成功,会破坏智力类艺术本身的意味,它们会让专业运动员的价值受到挑战,甚至让更多的人放弃学习棋牌类运动;有人却觉得这样的赛事可以普及各种棋类,让更多人对这些棋类、游戏等产生兴趣。而研究员们的看法时,尽管扑克AI可以在牌桌合理的赚到数百万美元,但是创造AI更大的目的是为了让他对世界有价值。AI在各种棋牌游戏和人类对战,其意义不在于输赢本身,更重要的是人们对这类游戏都耳熟能详,能够通过比赛了解到AI的最新进展,这对AI的发展有很大促进作用,毕竟AI进化的过程还相当长,即便是围观群众,也需要了解这个未来会与每个人的生活都息息相关的领域。

本文参考、整理编译于网络公开来源。并不代表AIPoker的官方观点。

参考整理来源:

https://blog.csdn.net/heyc861221/article/details/80129636

https://pokerground.com/en/can-ai-one-day-win-the-wsop-main-evet/