日报

和机器人打扑克,4名人类顶尖选手20天输了176万美元

刊登于 2017-02-01

德州扑克选手Jason Les与卡内基梅隆大学开发的 “Libratus”人工智能系统进行德州扑克比赛。
职业扑克玩家 Jason Les 有份参与人机对决扑克锦标赛。

最新动态:

经过长达20天的角逐,人机对决扑克锦标赛(Brains vs AI poker tournament)日前在美国匹兹堡 Rivers 赌场落下帷幕,卡内基梅隆大学(CMU)人工智能(AI)程序 Libratus 一路高歌猛进,从4位人类顶尖扑克玩家处总共赢取约176万美元筹码。这代表在“不完全信息”博弈中, AI 同样技高一筹。

以‘不完全信息’进行战略推理方面,最好的人工智能已经超越了最好的人类。

美国卡内基梅隆大学(CMU)计算机科学学院教授 Tuomas Sandholm

虽然迄今为止,被命名为 Libratus 的人工智能程序还只适用于扑克,但开发团队希望在更多领域尝试其能力,CMU 计算机科学学院的 Frank Pfenning 声称:“开发能够玩好扑克的 AI 是科学的巨大进步,它的原理可以被用于许多方面。想像一下,未来您的智能手机将在您购买新车时帮你砍价……现在只是个开始。”

Libratus 基于匹兹堡超级计算机中心(PSC)的超级电脑 Bridges 运行。据 CMU 透露,Bridges 的每秒浮点运算次数达1.35千万亿次(1.35 Petaflops),约等于高端笔记本电脑的7250倍;其内存达274 TB(Terabyte,万亿字节,1TB = 1024GB),约等于1万7500台普通笔记本电脑的总和。

在比赛过程中,由于 Libratus 能够将其前一天所犯战略错误在之后一天修正,所以有职业扑克玩家推测,CMU 研究人员会在比赛间隙的晚上手动修正程序。但 CMU 团队的赛后新闻稿澄清了相关猜测:“每天比赛结束后,一个元算法会分析人类玩家在 Libratus 的战略中发现与利用了什么战略漏洞,然后 AI 算法自主优先考虑修补位列前三的可被利用漏洞。”

不过目前大多数在线扑克玩家并不用担忧 Libratus,因为该程序仅适用于“一对一无限注德州扑克”(Heads-up No-limit Texas Hold'em Poker)玩法,具有三位或更多玩家的玩法显然会更为复杂,需要采用完全不同的策略与算法。

虽然经过20天的挣扎后,参与赛事的人类玩家输给了 Libratus,但他们还是可以根据各自表现瓜分20万美元的“奖金”。参与玩家之一 Jason Les 表示:“通常,为了获取类似经验你可能会损失掉很多钱,但在这里,我至少没有真正输掉任何钱。”

1月12日报导:人机对决扑克锦标赛美国开幕,“不完全信息”博弈人类能否技高一筹

2017年初,Google 人工智能系统 AlphaGo 横扫人类顶级围棋高手后,在喧嚣中宣布“结束网络测试”飘然而去。但人工智能与人类大脑的对决显然不会就此结束,美国当地时间1月11日,人机对决扑克锦标赛(Brains vs AI poker tournament)在匹兹堡的 Rivers 赌场正式拉开帷幕,四位全球顶级职业扑克玩家与人工智能程序 Libratus 在为期20天的赛程里,将以“一对一无限注德州扑克”(Heads-up No-limit Texas Hold'em Poker)玩法一决雌雄,并已在线上平台 Twitch 直播比赛进程

但无论胜负结果如何,参与锦标赛的 Dong Kim、Jason Les、Jimmy Chou 和 Daniel McAulay 这四位人类职业玩家,将根据各自表现瓜分20万美元的“奖金”;而被命名为 Liberatus 的人工智能程序如果能够获胜,则将像“深蓝”(Deep Blue)与 AlphaGo 一样青史留名。

自人工智能开始研发以来,能否击败顶级人类玩家一直是验证该领域进步程度的有效方式……但与其他游戏相比,扑克是一种更困难的挑战,因为它需要机器基于不完全信息(Imperfect Information)做出极其复杂的决定。

美国卡内基梅隆大学(CMU)计算机科学学院教授 Tuomas Sandholm

“在拥有完全信息的游戏里,人工智能可以在诸多可能性中选定一组进行推演,”卡内基梅隆大学教授 Tuomas Sandholm 说,他与其博士生 Noam Brown 共同开发了 Libratus 系统,“然而用不完全的信息进行游戏博弈时,形势要更加困难,因为人工智能不知道其他玩家拥有什么牌,这意味着程序无法在决策树(Decision tree)的架构下选择确定的下一步。此外,人工智能也不知道接下来会是那些牌出现在桌面上。”所以人工智能无法像在玩国际象棋或围棋时那样,通过计算所有步骤的胜率做出最优选择。

这是卡内基梅隆大学推出的第二场类似比赛,2015年时该校开发的人工智能程序 Claudico 在与 Dong Kim 等4位职业玩家的8万手较量中最终告负。曾参与2015年赛事的 Dong Kim 表示,他在与人工智能的对战中获益良多,他确信这些经验令他在面对其他人类玩家时拥有优势。

而在此次比赛开幕之前的1月6日,由加拿大和捷克研究人员组成的一个团队,抢先向学术论文预印本(Preprint)线上展示平台 arXiv 提交未定稿论文,称在一项涉及到数十位参与者和4.4万手扑克的研究中,他们开发的 DeepStack 成为世界上首个在“一对一无限注德州扑克”玩法中击败职业扑克玩家的计算机程序。但该论文尚未经过同行评审及正式发表,而 Tuomas Sandholm 教授认为他的这些同行们的人工智能系统“并没有跟顶级的人类玩家对抗,所以不能说已经击败了人类”。

12
在此次德州扑克比赛中,人工智能系统“Libratus”与4位人类选手总共将进行12万手的较量。

声音

我不认为扑克和国际象棋或围棋有什么不同,最终计算机也将主宰这个游戏……我们可能偶尔会占优势,但从长期来看,我会愿意把钱压在机器上,因为它有数学和科学。

参与锦标赛的人类顶尖扑克玩家 Jimmy Chou

作为职业扑克玩家,我不愿意承认这一点,但我确实相信机器将能在所有的扑克游戏中打败人类。这只是个时间问题。

参与锦标赛的人类顶尖扑克玩家 Dong Kim

德州扑克

德州扑克是世界上最流行的公牌扑克衍生游戏,也是国际扑克比赛的正式竞赛项目之一。世界扑克大赛(World Series of Poker,WSOP)和世界扑克巡回赛(World Poker Tour,WPT)的主赛事(Main Event)项目即是“无限注德州扑克”。德州扑克是美国多数赌场内最受欢迎的扑克牌类游戏,在美国以外的地区也十分流行,与桥牌的流行程度相当。理论上一桌同时最多可容纳22位(若不销牌则为23位)牌手,但一般是2至10人一桌。(资料来自维基百科,百科内容以 CC BY-SA 3.0 授权)

来源:麻省理工科技评论PhysMotherboardVerge

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。

延伸阅读