“人机对弈”第五局战况
3月15日中午12时,韩国围棋九段棋手李世石与 Google 人工智能程式 AlphaGo 之间的“人机对弈”展开最后一局较量。在经过5个小时的鏖战后,李世石最终未能携上一场获胜的余威再下一城,在五局的比赛中以总比分 1:4 负于 AlphaGo。
本场比赛之前,虽然在第四局较量中首度输给了李世石,但 AlphaGo 却得到了一个意外的收获:它正式进入了职业围棋棋手等级分排名——按照世界职业围棋排名网站 GoRatings 的计算规则,“棋手”必须有过败绩才能进入排名统计。而根据 AlphaGo 自去年10月“杀入”职业棋坛后的战绩,它已经超越李世石排名世界第四,仅次于中国棋手柯洁、韩国棋手朴廷桓及日本棋手井山裕太。
在双方的第四局较量中,执白的李世石下出被称为“神之一手”的78手后,AlphaGo 曾出现重大失误,它也因此被许多人认为存在“弱点”。对此,DeepMind 创始人哈萨比斯(Demis Hassabis)也承认 AlphaGo 确实有失误,但表示本次比赛的目的就是希望通过李世石来寻找其缺陷和测试极限。
AlphaGo 在执黑时可能会有些缺陷,既然这局我执白获胜,下一局能否不猜先(随机决定黑白),让我执黑,这样对我来说获胜更有意义。
由于李世石在第四局执白获胜,在他自己的要求下,第五局比赛由他执黑先行。李世石选择了较为稳健的开局,AlphaGo 则继续走出新鲜的招法。不过 AlphaGo 在右下角出现了令人费解的下法,白棋“送死”了数子,这也再次表现出 AlphaGo 似乎不太在乎局部的损失。
棋局进入中盘,李世石在左上角一手“尖冲”试图削弱中央白棋势力范围,但 AlphaGo 在空中反镇,中央模样逐渐成型;李世石在上边稳健做活,AlphaGo 又顺势围出中央大空。比赛进行不到3个小时,为新浪网担任直播解说的中国“棋圣”聂卫平就判断李世石形势不容乐观,认为他“很多地方看着好,但整体不好,如果这盘李世石输了,就是输在大局上”。
后半盘 AlphaGo 的实力开始展现,但李世石也并未放弃。尽管再次进入“读秒”,但李世石连续走出强硬下法,试图把局面变得更加复杂,以干扰 AlphaGo 的判断。但发挥稳健的 AlphaGo 把微弱的优势保持到了最后,李世石于180手投子认负。
聂卫平认为,AlphaGo 中盘实力极强,因此李世石只有“在布局取得领先,才有可能取胜”。他同时指出,在找出 AlphaGo 的“致命弱点”之前,谁都没有把握赢棋,并表示亦不看好目前排名世界第一的柯洁。
本次“人机对弈”落幕后,李世石共获得17万美元奖金,包括五场共计15万美元的出场费以及2万美元胜局费。Google 则计划将此前准备的100万美元胜者奖金捐赠给儿童和围棋慈善组织。
3月13日更新:“人机对弈”第四局战况
3月13日中午12时,韩国围棋九段棋手李世石与 Google 人工智能程序 AlphaGo 之间的“人机对弈”展开第四局,在近五个小时的激战之后,李世石最终扳回一局,取得首胜。
在12日第三局落败后,李世石称 AlphaGo 的程序虽然表现惊人,但也展现出弱点。而外界也期望李世石能在余下两局为人脑挣回一些面子。
这只是我李世石个人输掉了,并不是全人类。虽然 AlphaGo 的程序相当惊人,但毕竟还未达到完美的境地。
出战第四局时,李世石进场时神情较前几天轻松。但在对弈开始后,手执白子的李世石不断陷入长时间思考,而且逐渐落入下风。
战至中盘,AlphaGo 的思考时间比李世石足足用少近1小时,一些直播评论甚至认为已经看不到李世石有逆转的希望。眼看李世石即将进入每一手必须在60秒内落子的“读秒”阶段,令形势更加不利,但他却妙招频出,尤其于第78手下了一子妙棋,成功令僵局现出生机,并能逐步串连起占据棋盘各处的白成功令僵局现出生机,并能逐步串连起占据棋盘各处的白子。有职业棋手形容李世石下出“神之一手”,甚至猜测李世石是否已经看穿 AlphaGo 的行棋弱点,故意在布局阶段布下诱敌之阵。
李世石逆转形势后,在右方发动攻势,AlphaGo 开始计算应对办法。然而,AlphaGo 一度看似想在右方“提劫”,却没有成功,反而跑出“死子”。
有职业棋手判断,李世石下出 AlphaGo 计算以外的变化,让程序出现混乱,甚至笑言程序可能发生故障。现场评论指,就连 AlphaGo 开发者之一、连日来代其走子的黄士杰看到 AlphaGo 在右方下子招式时也面露困惑。
结果李世石成功在右方“收气”,稳住一大片形势。战至这个阶段,AlphaGo 每下一手平均都要思考3分钟以上。职业棋手们判断 AlphaGo 已无法扭转劣势,胜负已分。而李世石在“收官”阶段,仍然小心翼翼,没有出现失误。
最终,AlphaGo 投子认输,李世石获得首胜。这也是 AlphaGo 自去年10月以 5:0 战胜欧洲围棋冠军樊麾后,首次在对奕中向人类“投降”。
这场“人机对弈”的最后一局,将于3月15日中午12点进行。
3月12日更新:“人机对弈”第三局战况
3月12日中午12时,韩国围棋九段棋手李世石与 Google 人工智能程式 AlphaGo 之间的“人机对弈”三度开战,结果 AlphaGo 再次击败李世石,以总比分 3:0 成为此次对弈中的胜方。
赛前,已经落后两局的李世石显得有点紧张,不像之前一样牵着女儿、而是独自一人进场。棋局甫开,执黑子先行的李世石尝试抢攻,但很快被 AlphaGo 牵制住,而 AlphaGo 主动在左上角占地,令李世石只能忙于突围,避免在布局阶段落后太多。
战至中盘,一些直播此次对弈的职业棋手已经认为李世石难以逆转,棋局胜败已分。但李世石一度下子进取,尝试攻杀 AlphaGo 布置在左面的白子“大龙”,而 AlphaGo 却没有即时回应;职业棋手们此前看过 AlphaGo 异于人类的下棋方式,都不敢判断它是没有意识到黑子的意图,而估计它是经过精密计算,不觉得白子“大龙”有危险。结果,AlphaGo 不但于右路另开战局,亦成功应对了李世石在左路的进攻。
棋局较后阶段,评论普遍认为局面此局李世石必败,但李世石不断尝试造出“打劫”,并测试 AlphaGo 寻找“劫材”、应对“打劫”的能力。此前两局,一直没有出现“劫争”,也令外界猜测“劫争”是否 AlphaGo 的弱项,甚至该程式根本不懂“提劫”。亦有人质疑,此次比赛是否预先定下对李世石不利的“不能打劫的保密协议”。不过,AlphaGo 开发团队成员、代 AlphaGo 下子的黄士杰早前已发电邮澄清,双方没有定下这种保密协议;而在第三局上,AlphaGo 亦首次“提劫”,打破外界猜测。
最终,李世石无法扭转战局,于第176手投子认输。
尽管 AlphaGo 在这场五局三胜制的“人机对弈”已经获胜,但双方还是会继续完成余下两局,李世石仍有机会赢得一局。
这次比赛不论胜败如何,我觉得我们都应该尊重李世石九段,他接受 AlphaGo 的挑战,所承受的压力一定很大。
综观过去三局,AlphaGo 不时摆出“怪招”,某些起初看来似是失误,但最终被证明是致胜的关键,令职业棋手们惊讶。
韩国棋院秘书长梁宰豪形容,AlphaGo“就像是在山中自学成材的棋手”,看起来不像高手,每步下子亦无甚创意,但整局看来处处打破常规。他说,学棋者看了 AlphaGo 的独特下法后,将能开阔视野。
围棋是有着4千年历史的古典游戏,经历了漫长的发展过程,正如科学通过实证检验不断开拓新境界,人工智能也将为围棋拓展新空间带来积极影响。
韩国九段棋手赵惠连指,AlphaGo 将改写围棋历史,包括围棋的范式和学习方式,重新定义何谓围棋。
她说,人类和 AlphaGo 看待围棋的方式截然不同,人类倾向以较大目数赢棋,但 AlphaGo 的目标就只有赢棋,即使只赢半目。而人脑不能像电脑一样百分百精确无误地计算,因此职业棋手无法像 AlphaGo 一样下棋,“但人能做的,是更丰富地研究围棋”。
3月10日更新:“人机对弈”第二局战况
3月10日中午12时,韩国围棋九段棋手李世石与 Google 旗下 Deepmind 公司人工智能程式 AlphaGo 之间的“人机对弈”再度开战。在经过4个半小时的鏖战后,李世石再度落败,以总比分 0:2 落后于 AlphaGo。
首战告捷的 AlphaGo 在第二场比赛中执黑先行,继续保持“犀利”棋风,李世石则比首局落子更为谨慎。在本局比赛的前半段,AlphaGo 在局面上占据优势。中国“棋圣”聂卫平表示,对 AlphaGo 的下法“脱帽致敬”;为 Deepmind 担任直播评论的美国棋手、亦是世界上唯一一位非东亚裔的围棋九段 Michael Redmond 甚至表示,AlphaGo 第37手有围棋宗师吴清源的风范。
比赛后段,落子较慢的李世石陷入“时间危机”,他在用完双方各2小时的保留时间、进入“读秒”阶段时,AlphaGo 还有约20分钟。这意味着李世石接下来每一手必须在60秒内落子,若违反3次就会因超时被判负。李世石虽然顽强地将 AlphaGo 也拖入“读秒”,但不久之后便投子认负。
就算阿法狗(AlphaGo)战胜了李世石,但它赢不了我。
李世石虽然是本世纪获得冠军次数最多的棋手,但并非目前的世界第一,现世界围棋等级分排名第一的是年仅18岁的中国棋手柯洁。李世石首战告负后,柯洁立即在其个人微博表示,虽然 AlphaGo 战胜了李世石,“但它赢不了我”。
柯洁的言论引来不少网友批评及调侃。有网友称,“AlphaGo 当然赢不了你,因为如果在中国比赛,它会因为防火墙而连不上 Google 的服务器。”
不过,柯洁9日接受新华社采访时表示,对李世石的首场失利“震惊得说不出话”,AlphaGo 的“实力远超想象”,“下法简明自然,整个思路非常清晰”,“看它下棋特别像人类的思维模式,而且计算能力很精准,越到后面越精准,失误越少”。
柯洁认为李世石现在最关键是要调整好心态,并认为他自己与人工智能“早晚会有一战”,而且“还是相信自己会赢”。
3月9日第一局:谷歌人工智能对弈围棋世界冠军:AlphaGo 首战告捷!
3月9日,曾18次获得围棋世界冠军的韩国围棋九段棋手李世石与 Google 旗下 Deepmind 公司研发的人工智能程式 AlphaGo 在首尔四季酒店开始对弈,结果第一局由 AlphaGo 胜出,之后四局将于10日至15日分别举行,Deepmind 的 YouTube 频道均会进行现场直播。
这场被誉为“人机对决”的围棋比赛将以五局三胜制进行。双方按此前约定,采用中国规则、黑贴3又3/4子。即使一方首先取得三胜,也会全部下完五局,而最终胜方可获得100万美元奖金;假如胜方全胜5局,更可额外多获25万美元奖金。
首局对奕历时近4个小时。开局时,AlphaGo 下子小心翼翼,但进入中局,明显变得进取,甚至棋行险著。为 Deepmind 担任直播评论的九段棋手 Michael Redmond 指 ,AlphaGo 相比去年10月攻败欧洲围棋冠军樊麾时,技术又有明显进步,犯错更少。
有分析指,由于人工智能的表现比较稳定,第一局已能反映其到能到达的水准,因此透过第一局的胜负已大概能预测到最终战果。
我相信这不会是一场旗鼓相当的比赛,估计(最后比分)是5-0或4-1。对我来说,关键是一场都不会输……同机器比赛跟人类有很大差异,假如对手是人,你会感受到对方的呼吸、精神,很多时你会基于一些身体反应而做决定,但对手是机器就没有这些参考了。
李世石现年33岁,是当今世界三大围棋高手之一,出道之初以棋风锐利、擅长大规模攻杀见称。近年他的棋风更加成熟,在多次世界围棋大赛中,他均在开始落后的情况下最终逆转胜出。
李世石的对手是Google 旗下 Deepmind 公司研发的人工智能程式 AlphaGo。去年10月, AlphaGo 曾以5局全势的姿态,击败3届欧洲围棋冠军、二段棋手樊麾。
《自然》杂志于今年1月刊登的文章解释,AlphaGo 在蒙地卡罗树搜索中同时采用2个深度神经网络,分别是选择下子的策略神经网络(Policy Network)及评估选点的价值神经网络(Value Network);前者负责计算每步棋的走法,后者则负责“想像”、推算可能出现的局面,让AlphaGo 能高度模拟人脑在下围棋时凭直觉快速锁定策略的思维逻辑。此外,工程师们为 Alpha 上载了围棋高手们超过 3000 万步的棋步,并让价值神经网络进行了高达2000万次自我对局的训练,最终才让 AlphaGo 走上比赛桌。