纸牌AI新领域,Hanabi心理战

AI已经在一些复杂的游戏中取得了丰硕的成果。如围棋、国际象棋等具备完美信息条件的游戏,甚至AI在一对一德州扑克比赛中也有不俗的表现。

AI研究人员在游戏领域里不断精进,目的并不是为了让计算机在智力游戏中实现制霸,而是借助不同游戏的玩法与规则,让AI从中学习、模仿人类智慧、心理的互动决策过程。

2010年诞生于日本的卡牌桌游“Hanabi”(名为:花火),如今已成为AI研究人员们青睐的研究对象。

2019年2月1日,康奈尔大学的研究团队首度提交出关于“Hanabi”与“AI”的论文,《挑战Hanabi,AI研究的新前沿》。在这篇论文中,研究人员表示,Hanabi是一个关于沟通与协作的纸牌类游戏,这一领域的AI研究尚属空白。

Hanabi是一种2~5人制的合作型卡牌游戏,玩家不能观看自己的牌,只能看其他玩家的。游戏的玩法是要将不同花色的数字牌顺序排列完成,成功释放“花火”。玩家通过每回合有限的资讯,透过推理、整合和默契等来完成游戏。2013年,Hanabi作为新型纸牌游戏,一举拿下全球数个权威游戏大奖,在业界收获了足够的认可。

Hanabi的玩法简介:

基础模式的花火牌组共50张牌,包含五种花色(红、黄、蓝、绿、白),每组花色有三张1、两张2、3、4以及一张5。

游戏开始时配以8个可用的资讯标记和3个防火标记。开始游戏时,每名玩家根据游戏人数而获发4或5牌(四人或以上为4张),持牌以卡背面向自己,让其他玩家观看自己的手牌,而玩家则不能观看自己的牌。

游戏以轮流回合形式进行,每名玩家在其回合必须作出以下一个行动:

  • 提供资讯:一名玩家需要指示一名其他玩家一种花色或数字的全部牌所处的位置。玩家须给出完整及正确无误的资讯,玩家亦可指定一项持牌者没有的花色或数字为资讯。每次提供资讯须消耗一个资讯标记,当资讯标记为零时,则不能选择提供资讯。
  • 弃置手牌:一名玩家可以选择弃置自己的一张手牌至弃牌堆。此牌不能再加入游戏及打出。弃置一张手牌可以补充一个资讯标记,并摸一张牌。当资讯标记为满(八个)时,玩家不能选择弃置手牌。
  • 打出手牌:玩家可以尝试打出一张牌,若此牌可按花色顺序正确排列(如桌面上的红色牌为2,玩家打出红色3),则此牌为有效。否则玩家消耗一个防火标记,累积3个即输,游戏完结。当玩家成功打出一种花色的完整一组5张牌,则可补充一个资讯标记(上限为8),然后玩家不论打出成功与否均须摸一张牌。

游戏以轮流回合制进行,直至牌库里没有牌时便是最后一个回合。基础版的最高分数为25分。

组合出来的花火牌分为四个基本模式:

  • 五花色:是游戏最基本的模式,只使用五种花色的牌,满分为25分。
  • 六花色10牌:是游戏的进阶模式,第六种颜色(混色)亦是如常包含10张牌。
  • 第六花色5牌:是上述模式的困难版,混色只有5张牌,为1-5各一张。
  • 彩色:是游戏四种模式中最难的模式,牌堆与六花色10牌相同,但玩家不能提示“混色”,只有当提示两种颜色时才能提示。

    纸牌游戏中的心理战

在Hanabi游戏中,玩家可以看见对手的牌,却看不见自己的牌。为了弥补这一信息差距,玩家之间互相提供手牌提示,让出牌人自己推断下一步行动。但提示仅限于颜色和数字,而且提示的次数也是有限制的。

只能通过“有限沟通”来达成“有效目的”的方式,使Hanabi在科学上具备了很强的吸引力。人类可以自然消化别的玩家的暗示,但机器本质上却无法理解。

Hanabi需要参与的玩家共同协作,如果参与者是临时组队、彼此之间并不了解,就意味着不可预知的游戏过程中包含着巨大的挑战与丰富的信息。

人类通常基于自己的思考和行动去构建关于他人的“心理理论”,并预测他人的行动。“心理”在游戏中的作用非常之大,所以研究人员期待AI能够透过游戏,去识别学习人类语境中的“心理线索”,进而推断他人的想法。

研究人员认为,在日常生活中,人们主要花时间用于沟通合作,而不是互相竞争。如果能够创建出基于“Hanabi”的AI大师,则代表人工智能的重大进步,能够帮助机器在日常对话和自动驾驶领域与人类更流畅地互动。

AI能掌握“信息解读”的能力吗

AI在各种纸牌类游戏中都取得了一些进展,却无法掌握这些游戏。其中部分原因是此类游戏的玩法需要具备信息的沟通与解读技能。目前的AI显然无法具备读懂玩家隐藏行为的能力。

但诸多的AI研究者寄希望于各类需要复杂心理博弈的纸牌游戏,通过随机的对手和复杂的游戏局面来获取大量的游戏语境和游戏数据,看看机器能否弄清楚对手在思考什么、对手即将做点什么。这一巨大的挑战正激起越来越多AI专家的热情。

Hanabi挑战的研究人员们建立了一个基于Python和C++的开源平台,对这一研究感兴趣的人士可以在平台中试验各类AI算法或者玩法模拟。不过这一方向的研究只是刚刚开始而已,相信短期之内无法看到巨大的进展。

但Hanabi研究团队相信,作为目前主流AI算法的补充,开发基于心理理论的AI新技术是非常关键的。这一领域的新探索也将在未来更广泛的AI应用中起到至关重要的作用。


本文参考、整理编译于网络公开来源。并不代表AIPoker的官方观点。

参考整理来源:

Google Brain and DeepMind researchers release AI benchmark based on card game Hanabi

https://www.wsj.com/articles/why-the-card-game-hanabi-is-the-next-big-hurdle-for-artificial-intelligence-11553875351

https://arxiv.org/abs/1902.00506

https://zh.wikipedia.org/wiki/%E8%8A%B1%E7%81%AB_(%E5%8D%A1%E7%89%8C%E9%81%8A%E6%88%B2)