最新动态:
经过长达20天的角逐,人机对决扑克锦标赛(Brains vs AI poker tournament)日前在美国匹兹堡 Rivers 赌场落下帷幕,卡内基梅隆大学(CMU)人工智能(AI)程序 Libratus 一路高歌猛进,从4位人类顶尖扑克玩家处总共赢取约176万美元筹码。这代表在“不完全信息”博弈中, AI 同样技高一筹。
以‘不完全信息’进行战略推理方面,最好的人工智能已经超越了最好的人类。
虽然迄今为止,被命名为 Libratus 的人工智能程序还只适用于扑克,但开发团队希望在更多领域尝试其能力,CMU 计算机科学学院的 Frank Pfenning 声称:“开发能够玩好扑克的 AI 是科学的巨大进步,它的原理可以被用于许多方面。想像一下,未来您的智能手机将在您购买新车时帮你砍价……现在只是个开始。”
Libratus 基于匹兹堡超级计算机中心(PSC)的超级电脑 Bridges 运行。据 CMU 透露,Bridges 的每秒浮点运算次数达1.35千万亿次(1.35 Petaflops),约等于高端笔记本电脑的7250倍;其内存达274 TB(Terabyte,万亿字节,1TB = 1024GB),约等于1万7500台普通笔记本电脑的总和。
在比赛过程中,由于 Libratus 能够将其前一天所犯战略错误在之后一天修正,所以有职业扑克玩家推测,CMU 研究人员会在比赛间隙的晚上手动修正程序。但 CMU 团队的赛后新闻稿澄清了相关猜测:“每天比赛结束后,一个元算法会分析人类玩家在 Libratus 的战略中发现与利用了什么战略漏洞,然后 AI 算法自主优先考虑修补位列前三的可被利用漏洞。”
不过目前大多数在线扑克玩家并不用担忧 Libratus,因为该程序仅适用于“一对一无限注德州扑克”(Heads-up No-limit Texas Hold'em Poker)玩法,具有三位或更多玩家的玩法显然会更为复杂,需要采用完全不同的策略与算法。
虽然经过20天的挣扎后,参与赛事的人类玩家输给了 Libratus,但他们还是可以根据各自表现瓜分20万美元的“奖金”。参与玩家之一 Jason Les 表示:“通常,为了获取类似经验你可能会损失掉很多钱,但在这里,我至少没有真正输掉任何钱。”
1月12日报导:人机对决扑克锦标赛美国开幕,“不完全信息”博弈人类能否技高一筹
2017年初,Google 人工智能系统 AlphaGo 横扫人类顶级围棋高手后,在喧嚣中宣布“结束网络测试”飘然而去。但人工智能与人类大脑的对决显然不会就此结束,美国当地时间1月11日,人机对决扑克锦标赛(Brains vs AI poker tournament)在匹兹堡的 Rivers 赌场正式拉开帷幕,四位全球顶级职业扑克玩家与人工智能程序 Libratus 在为期20天的赛程里,将以“一对一无限注德州扑克”(Heads-up No-limit Texas Hold'em Poker)玩法一决雌雄,并已在线上平台 Twitch 直播比赛进程。
但无论胜负结果如何,参与锦标赛的 Dong Kim、Jason Les、Jimmy Chou 和 Daniel McAulay 这四位人类职业玩家,将根据各自表现瓜分20万美元的“奖金”;而被命名为 Liberatus 的人工智能程序如果能够获胜,则将像“深蓝”(Deep Blue)与 AlphaGo 一样青史留名。
自人工智能开始研发以来,能否击败顶级人类玩家一直是验证该领域进步程度的有效方式……但与其他游戏相比,扑克是一种更困难的挑战,因为它需要机器基于不完全信息(Imperfect Information)做出极其复杂的决定。
“在拥有完全信息的游戏里,人工智能可以在诸多可能性中选定一组进行推演,”卡内基梅隆大学教授 Tuomas Sandholm 说,他与其博士生 Noam Brown 共同开发了 Libratus 系统,“然而用不完全的信息进行游戏博弈时,形势要更加困难,因为人工智能不知道其他玩家拥有什么牌,这意味着程序无法在决策树(Decision tree)的架构下选择确定的下一步。此外,人工智能也不知道接下来会是那些牌出现在桌面上。”所以人工智能无法像在玩国际象棋或围棋时那样,通过计算所有步骤的胜率做出最优选择。
这是卡内基梅隆大学推出的第二场类似比赛,2015年时该校开发的人工智能程序 Claudico 在与 Dong Kim 等4位职业玩家的8万手较量中最终告负。曾参与2015年赛事的 Dong Kim 表示,他在与人工智能的对战中获益良多,他确信这些经验令他在面对其他人类玩家时拥有优势。
而在此次比赛开幕之前的1月6日,由加拿大和捷克研究人员组成的一个团队,抢先向学术论文预印本(Preprint)线上展示平台 arXiv 提交未定稿论文,称在一项涉及到数十位参与者和4.4万手扑克的研究中,他们开发的 DeepStack 成为世界上首个在“一对一无限注德州扑克”玩法中击败职业扑克玩家的计算机程序。但该论文尚未经过同行评审及正式发表,而 Tuomas Sandholm 教授认为他的这些同行们的人工智能系统“并没有跟顶级的人类玩家对抗,所以不能说已经击败了人类”。