AlphaGo打扑克,可否唬过对手?(alphago输过吗)

AlphaGo打扑克,可否唬过对手?(alphago输过吗)
AlphaGo打扑克,可否唬过对手?(alphago输过吗)

谷歌Deep Mind部门人工智能软件的元老之一近日表示,相似的机器学习方法可以使AlphaGo成为一名优秀的扑克玩家。

扑克向来是被认为比围棋难使用人工智能的游戏。在象棋以及围棋类的棋盘游戏中,信息是全面的,因为双方都可以看到一切旗子。而扑克则是一种“不全面信息”的游戏,因为在对抗过程中,玩家只知道自己的牌以及桌面上的牌。玩家需要结合已知的明牌,以及对对手牌的猜测来决策。因此,扑克玩家在玩牌的过程中,会试图通过概率以及微动作来“读”懂其他玩家的行为以及牌面。

由于扑克的性质,企图通过机器学习来创造打扑克的软件对人工智能来说将是一个非常大的挑战。而且,因为扑克和博弈论相连,它也会有谈判以及合作的一面。

虽然围棋无比的复杂而且全部战术很难被直接编写成代码,但起码 AlphaGo 可以看到棋盘上的一切。AlphaGo 在两种人工智能技术,深度强化学习以及树搜索的帮助下,可以自我算出最佳落子点。简单来说,深度强化学习是一种是通过正面回报和负面回报来训练大型神经网络的技术,树搜索则是一种计算未来步数的数学方式。

伦敦大学学院(UCL)的讲师,AlphaGo 团队的首席研究员大卫-西尔弗(David Silver)曾在这月初发表了一片论文,阐述了如何通过相似的方式来创造一个扑克机器人。在一名 UCL 的研究生约翰内斯-海因里克(Johannes Heinrich)的帮助下,西尔弗成功的使用深度加强学习计算出了两种扑克游戏的有效玩法。

这两种游戏之一是“Leduc”,一款只有6张牌的简易玩法,另外一种则是德州扑克,全世界最受欢迎的扑克玩法。在 Leduc 中,他们的软件达到了纳什均衡,博弈论中的最优反应。在德州扑克中,这软件达到了高级玩家的水准。

在此同时,一组由牛津大学以及谷歌 DeepMind 的研究员组成的团队,把他们的注意力转向了两款魔幻卡牌游戏:万智牌和炉石传说。在这两款游戏中,玩家使用代表各种不同的魔法,武器,以及怪物的牌来攻击对手。

目前,此项目还处于初期。这个团队仅仅在训练他们的神经网络如何理解每张卡牌。他们将使用有结构方式,例如通过颜色或数字,以及无结构方式,例如通过每张牌的文字,来理解卡牌。

很显然,谷歌的人工智能团队还没有结束他们制造超人类游戏机器的道路。

麻省理工科技评论倾力打造:DeepTech深科技(公众号:mit-tr)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。