为什么说扑克AI是人工智能的重要里程碑

全球顶级的AI专家们都具备这样的共识:扑克是人工智能最难破解的游戏之一。扑克需要推理和智慧、且不存在一个唯一的最佳策略,使得机器难以模仿。

为什么扑克游戏难以被AI完全掌控?

AI的“全知全能”需要制定基于游戏规则和已知全部信息的完美策略,而扑克游戏中则包含了大量的隐藏信息,这与能显示对手棋子的棋盘不同。在扑克游戏中,对手的牌是隐藏的。所以扑克拥有几乎无限的随机状况,比宇宙中的原子数还要大。

扑克游戏具备“不完美信息”的特性,想根据对手可能采取的每种打法,计算出理想的策略是非常复杂的。尤其是无限制德州扑克,因为对手基本上可以在任何时候以任何金额下注。

扑克不仅是不完美信息游戏的代表,涉及大量隐藏信息;玩法中还包括“诈唬”等虚张声势的人类属性。

2017年,由卡内基梅洛大学教授托马斯·桑德霍姆Tuomas Sandholm和诺姆·布朗Noam Brown创建的人工智能项目Libratus 在一系列与职业扑克选手一对一的对弈中取得了胜利。这是AI历史上首次取得扑克领域的重大突破。

Libratus 通过基于蒙特卡洛CFR(一种平衡求解理论,AI研究人员使用博弈论或战略决策的数学应用来找到给定各种不确定性的最佳策略,称为均衡。)的新延伸应用来构建,用来回避扑克中机器难以解决的抽象部分,这种计算方式不会频繁地对悔牌行为进行抽样。

博弈论告诉研究人员如何以某种状况下的最优化方式对游戏进行随机化。Libratus的设计指令是在当前条件下赢得尽可能多的钱,AI对优化奖励实行了优化组合。

从第三轮下注起,Libratus 利用程序嵌套的子方案,响应之后对手的每次下注。这使得Libratus 忽略掉人类的行为,用子方案响应对手在信息决策树以外的任何动作,从而拥有一定获得胜利的概率。

换句话说,Libratus在与真人的扑克比赛中钻了规则的空子,Libratus并不是人们以为的那种,能够在牌桌上用人工智能打败人类智慧的”AI“,而是一种数学模型。

AI从扑克游戏中能学习到什么?

扑克游戏包含虚张声势,AI要做的不仅仅是基于对手的下一手动作和在棋盘上落子的下一步来做出决策点,一名成熟的扑克玩家要做到的还涉及识别、理解对手的行为策略。

人工智能不像人类那样可以思考或做出常识性决定。玩游戏的AI并不知道自己在玩游戏,也不明白游戏是什么。但是,在许多情况下人工智能比人类更聪明,更快,特别是当它可以训练去完成特定任务时。但AI无法在游戏进行时,同时发挥两方面的作用:知道自己在做什么,分析对手正在计划什么。

专家们渴望从扑克游戏中获得更多,趋于无限的计算量,不断演进的计算模型、通过传感器去读取比赛中人类的表情、体温、心跳变化等情绪反应背后的意义,甚至说,用AI去模仿学习人类在牌桌上是如何“欺骗”的。

无限制德州扑克是信息不完整的游戏,人工智能必须推断人类玩家的意图,然后以此为依据随机行事。以“Libratus”为代表的一系列扑克领域中的超级程序,希望将扑克游戏拆分成“计算可管理的部分”+“学习玩法中隐藏且不可预测的部分”。

计算机具有速度,耐力和对人类无法获得的巨大数据集的访问权限。在算牌部分,AI的计算处理功能拥有极大的优势。研究人员希望通过强化学习,如自我对抗、自我学习来扩大这一点,并根据其对手的游戏玩法,在比赛期间修复其策略中的潜在弱点。

扑克AI是人工智能的重要里程碑

尽管目前为止,具备超级演算能力的AI不会普遍存在。以“Libratus”为例,它需要三台超级计算机才能驱动用于战术改进,同时最多也只能应对两名选手,避免牌桌上非常复杂的牌面对话。

但在扑克Ai领域取得的任何成果,都会对人工智能的开发产生里程碑意义。这已是全球AI工作者的共识。

隐藏信息在现实世界的战略互动中无处不在,利用不完整的信息来解决现实问题,将有助于推动社会的发展,而不仅限于扑克游戏领域。玩游戏的AI正在提醒我们,人工智能已开始在我们的生活中发挥重要作用,还将在未来施以更多的变化。也许今天的扑克AI就能称为明天的世界引擎。

目前,全球的研究人员正向六人制无限制德州扑克展开挑战。

本文整理、编译于网络多方报道。

参考资料:
https://www.technologyreview.com/s/603385/why-poker-is-a-big-deal-for-artificial-intelligence/
https://bigthink.com/david-ryan-polgar/poker-is-harder-for-ai-to-master-than-chess-ai-has-now-learned-to-bluff-and-beat-humans
https://www.theguardian.com/technology/2017/feb/05/artificial-intelligence-ethics-poker-libratus-texas-holdem-ai-deepstack
https://www.entrepreneur.com/article/305299