日報

「人機對弈」落幕:李世石 1:4 負於 AlphaGo

刊登於 2016-03-15

南韓圍棋九段棋手李世石與 AIphaGo 對弈中。攝 : AFP/Google DeepMind/GOOGLE
南韓圍棋九段棋手李世石與 AIphaGo 對弈中。

「人機對弈」第五局戰況

3月15日中午12時,南韓圍棋九段棋手李世石與 Google 人工智能程式 AlphaGo 之間的「人機對弈」展開最後一局較量。在經過5個小時的鏖戰後,李世石最終未能攜上一場獲勝的餘威再下一城,在五局的比賽中以總比分 1:4 負於 AlphaGo。

本場比賽之前,雖然在第四局較量中首度輸給了李世石,但 AlphaGo 卻得到了一個意外的收穫:它正式進入了職業圍棋棋手等級分排名——按照世界職業圍棋排名網站 GoRatings 的計算規則,「棋手」必須有過敗績才能進入排名統計。而根據 AlphaGo 自去年10月「殺入」職業棋壇後的戰績,它已經超越李世石排名世界第四,僅次於中國棋手柯潔、韓國棋手朴廷桓及日本棋手井山裕太。

在雙方的第四局較量中,執白的李世石下出被稱為「神之一手」的78手後,AlphaGo 曾出現重大失誤,它也因此被許多人認為存在「弱點」。對此,DeepMind 創始人哈薩比斯(Demis Hassabis)也承認 AlphaGo 確實有失誤,但表示本次比賽的目的就是希望通過李世石來尋找其缺陷和測試極限。

AlphaGo 在執黑時可能會有些缺陷,既然這局我執白獲勝,下一局能否不猜先(隨機決定黑白),讓我執黑,這樣對我來説獲勝更有意義。

李世石在第四局獲勝後表示

由於李世石在第四局執白獲勝,在他自己的要求下,第五局比賽由他執黑先行。李世石選擇了較為穩健的開局,AlphaGo 則繼續走出新鮮的招法。不過 AlphaGo 在右下角出現了令人費解的下法,白棋「送死」了數子,這也再次表現出 AlphaGo 似乎不太在乎局部的損失。

棋局進入中盤,李世石在左上角一手「尖衝」試圖削弱中央白棋勢力範圍,但 AlphaGo 在空中反鎮,中央模樣逐漸成型;李世石在上邊穩健做活,AlphaGo 又順勢圍出中央大空。比賽進行不到3個小時,為新浪網擔任直播解說的中國「棋聖」聶衞平就判斷李世石形勢不容樂觀,認為他「很多地方看着好,但整體不好,如果這盤李世石輸了,就是輸在大局上」。

後半盤 AlphaGo 的實力開始展現,但李世石也並未放棄。儘管再次進入「讀秒」,但李世石連續走出強硬下法,試圖把局面變得更加複雜,以干擾 AlphaGo 的判斷。但發揮穩健的 AlphaGo 把微弱的優勢保持到了最後,李世石於180手投子認負。

聶衛平認為,AlphaGo 中盤實力極強,因此李世石只有「在布局取得領先,才有可能取勝」。他同時指出,在找出 AlphaGo 的「致命弱點」之前,誰都沒有把握贏棋,並表示亦不看好目前排名世界第一的柯潔。

本次「人機對弈」落幕後,李世石共獲得17萬美元獎金,包括五場共計15萬美元的出場費以及2萬美元勝局費。Google 則計劃將此前準備的100萬美元勝者獎金捐贈給兒童和圍棋慈善組織。

3月13日更新:「人機對弈」第四局戰況

3月13日中午12時,南韓圍棋九段棋手李世石與 Google 人工智能程式 AlphaGo 之間的「人機對弈」展開第四局,在近五個小時的激戰之後,李世石最終扳回一局,取得首勝。

在12日第三局落敗後,李世石稱 AlphaGo 的程式雖然表現驚人,但也展現出弱點。而外界也期望李世石能在餘下兩局為人腦掙回一些面子。

這只是我李世石個人輸掉了,並不是全人類。雖然 AlphaGo 的程式相當驚人,但畢竟還未達到完美的境地。

南韓圍棋九段棋手李世石於第三局落敗後說

出戰第四局時,李世石進場時神情較前幾天輕鬆。但在對弈開始後,手執白子的李世石不斷陷入長時間思考,而且逐漸落入下風。

戰至中盤,AlphaGo 的思考時間比李世石足足用少近1小時,一些直播評論甚至認為已經看不到李世石有逆轉的希望。眼看李世石即將進入每一手必須在60秒內落子的「讀秒」階段,令形勢更加不利,但他卻妙招頻出,尤其於第78手下了一子妙棋,成功令僵局現出生機,並能逐步串連起佔據棋盤各處的白子。有職業棋手形容李世石下出「神之一手」,甚至猜測李世石是否已經看穿 AlphaGo 的行棋弱點,故意在布局階段布下誘敵之陣。

李世石逆轉形勢後,在右方發動攻勢,AlphaGo 開始計算應對辦法。然而,AlphaGo 一度看似想在右方「提劫」,卻沒有成功,反而跑出「死子」。

有職業棋手判斷,李世石下出 AlphaGo 計算以外的變化,讓程式出現混亂,甚至笑言程式可能發生故障。現場評論指,就連 AlphaGo 開發者之一、連日來代其走子的黃士傑看到 AlphaGo 在右方下子招式時也面露困惑。

結果李世石成功在右方「收氣」,穩住一大片形勢。戰至這個階段,AlphaGo 每下一手平均都要思考3分鐘以上。職業棋手們判斷 AlphaGo 已無法扭轉劣勢,勝負已分。而李世石在「收官」階段,仍然小心翼翼,沒有出現失誤。

最終,AlphaGo 投子認輸,李世石獲得首勝。這也是 AlphaGo 自去年10月以 5:0 戰勝歐洲圍棋冠軍樊麾後,首次在對奕中向人類「投降」。

這場「人機對弈」的最後一局,將於3月15日中午12點進行。

3月12日更新:「人機對弈」第三局戰況

3月12日中午12時,南韓圍棋九段棋手李世石與 Google 人工智能程式 AlphaGo 之間的「人機對弈」三度開戰,結果 AlphaGo 再次擊敗李世石,以總比分 3:0 成為此次對弈中的勝方。

賽前,已經落後兩局的李世石顯得有點緊張,不像之前一樣牽着女兒、而是獨自一人進場。棋局甫開,執黑子先行的李世石嘗試搶攻,但很快被 AlphaGo 牽制住,而 AlphaGo 主動在左上角佔地,令李世石只能忙於突圍,避免在布局階段落後太多。

戰至中盤,一些直播此次對弈的職業棋手已經認為李世石難以逆轉,棋局勝敗已分。但李世石一度下子進取,嘗試攻殺 AlphaGo 布置在左面的白子「大龍」,而 AlphaGo 卻沒有即時回應;職業棋手們此前看過 AlphaGo 異於人類的下棋方式,都不敢判斷它是沒有意識到黑子的意圖,而估計它是經過精密計算,不覺得白子「大龍」有危險。結果,AlphaGo 不但於右路另開戰局,亦成功應對了李世石在左路的進攻。

棋局較後階段,評論普遍認為局面此局李世石必敗,但李世石不斷嘗試造出「打劫」,並測試 AlphaGo 尋找「劫材」、應對「打劫」的能力。此前兩局,一直沒有出現「劫爭」,也令外界猜測「劫爭」是否 AlphaGo 的弱項,甚至該程式根本不懂「提劫」。亦有人質疑,此次比賽是否預先定下對李世石不利的「不能打劫的保密協議」。不過,AlphaGo 開發團隊成員、代 AlphaGo 下子的黃士傑早前已發電郵澄清,雙方沒有定下這種保密協議;而在第三局上,AlphaGo 亦首次「提劫」,打破外界猜測。

最終,李世石無法扭轉戰局,於第176手投子認輸。

儘管 AlphaGo 在這場五局三勝制的「人機對弈」已經獲勝,但雙方還是會繼續完成餘下兩局,李世石仍有機會贏得一局。

這次比賽不論勝敗如何,我覺得我們都應該尊重李世石九段,他接受 AlphaGo 的挑戰,所承受的壓力一定很大。

AlphaGo 開發團隊成員、代 AlphaGo 下子的黃士傑

綜觀過去三局,AlphaGo 不時擺出「怪招」,某些起初看來似是失誤,但最終被證明是致勝的關鍵,令職業棋手們驚訝。

韓國棋院秘書長梁宰豪形容,AlphaGo「就像是在山中自學成材的棋手」,看起來不像高手,每步下子亦無甚創意,但整局看來處處打破常規。他說,學棋者看了 AlphaGo 的獨特下法後,將能開闊視野。

圍棋是有着4千年歷史的古典遊戲,經歷了漫長的發展過程,正如科學通過實證檢驗不斷開拓新境界,人工智能也將為圍棋拓展新空間帶來積極影響。

南韓九段棋手趙惠連

南韓九段棋手趙惠連指,AlphaGo 將改寫圍棋歷史,包括圍棋的範式和學習方式,重新定義何謂圍棋。

她說,人類和 AlphaGo 看待圍棋的方式截然不同,人類傾向以較大目數贏棋,但 AlphaGo 的目標就只有贏棋,即使只贏半目。而人腦不能像電腦一樣百分百精確無誤地計算,因此職業棋手無法像 AlphaGo 一樣下棋,「但人能做的,是更豐富地研究圍棋」。

3月10日更新:「人機對弈」第二局戰況

「人機對弈」第二局完結, AlphaGo 再次獲勝。Google Deepmind Youtube截圖
「人機對弈」第二局完結, AlphaGo 再次獲勝。

3月10日中午12時,南韓圍棋九段棋手李世石與 Google 旗下 Deepmind 公司人工智能程式 AlphaGo 之間的「人機對弈」再度開戰。在經過4個半小時的鏖戰後,李世石再度落敗,以總比分 0:2 落後於 AlphaGo。

首戰告捷的 AlphaGo 在第二場比賽中執黑先行,繼續保持「犀利」棋風,李世石則比首局落子更為謹慎。在本局比賽的前半段,AlphaGo 在局面上佔據優勢。中國「棋聖」聶衛平表示,對 AlphaGo 的下法「脱帽致敬」;為 Deepmind 擔任直播評論的美國棋手、亦是世界上唯一一位非東亞裔的圍棋九段 Michael Redmond 甚至表示,AlphaGo 第37手有圍棋宗師吳清源的風範。

比賽後段,落子較慢的李世石陷入「時間危機」,他在用完雙方各2小時的保留時間、進入「讀秒」階段時,AlphaGo 還有約20分鐘。這意味着李世石接下來每一手必須在60秒內落子,若違反3次就會因超時被判負。李世石雖然頑強地將 AlphaGo 也拖入「讀秒」,但不久之後便投子認負。

就算阿法狗(AlphaGo)戰勝了李世石,但它贏不了我。

3月9日,中國棋手柯潔

李世石雖然是本世紀獲得冠軍次數最多的棋手,但並非目前的世界第一,現世界圍棋等級分排名第一的是年僅18歲的中國棋手柯潔。李世石首戰告負後,柯潔立即在其個人微博表示,雖然 AlphaGo 戰勝了李世石,「但它贏不了我」。

柯潔的言論引來不少網友批評及調侃。有網友稱,「AlphaGo 當然贏不了你,因為如果在中國比賽,它會因為防火墻而連不上 Google 的服務器。」

不過,柯潔9日接受新華社採訪時表示,對李世石的首場失利「震驚得説不出話」,AlphaGo 的「實力遠超想象」,「下法簡明自然,整個思路非常清晰」,「看它下棋特別像人類的思維模式,而且計算能力很精準,越到後面越精準,失誤越少」。

柯潔認為李世石現在最關鍵是要調整好心態,並認為他自己與人工智能「早晚會有一戰」,而且「還是相信自己會贏」。

3月9日第一局:谷歌人工智能對弈圍棋世界冠軍:AlphaGo 首戰告捷!

3月9日,曾18次獲得圍棋世界冠軍的南韓圍棋九段棋手李世石與 Google 旗下 Deepmind 公司研發的人工智能程式 AlphaGo 在首爾四季酒店開始對弈,結果第一局由 AlphaGo 勝出,之後四局將於10日至15日分別舉行,Deepmind 的 YouTube 頻道均會進行現場直播。

這場被譽為「人機對決」的圍棋比賽將以五局三勝制進行。雙方按此前約定,採用中國規則、黑貼3又3/4子。即使一方首先取得三勝,也會全部下完五局,而最終勝方可獲得100萬美元奬金;假如勝方全勝5局,更可額外多獲25萬美元奬金。

李世石與 AlphaGo 首戰結束時的棋局。DeepMind 直播視頻截圖
李世石與 AlphaGo 首戰結束時的棋局。

首局對奕歷時近4個小時。開局時,AlphaGo 下子小心翼翼,但進入中局,明顯變得進取,甚至棋行險著。為 Deepmind 擔任直播評論的九段棋手 Michael Redmond 指 ,AlphaGo 相比去年10月攻敗歐洲圍棋冠軍樊麾時,技術又有明顯進步,犯錯更少。

有分析指,由於人工智能的表現比較穩定,第一局已能反映其到能到達的水準,因此透過第一局的勝負已大概能預測到最終戰果。

我相信這不會是一場旗鼓相當的比賽,估計(最後比分)是5-0或4-1。對我來說,關鍵是一場都不會輸……同機器比賽跟人類有很大差異,假如對手是人,你會感受到對方的呼吸、精神,很多時你會基於一些身體反應而做決定,但對手是機器就沒有這些參考了。

南韓圍棋九段棋手李世石在賽前說

李世石現年33歲,是當今世界三大圍棋高手之一,出道之初以棋風銳利、擅長大規模攻殺見稱。近年他的棋風更加成熟,在多次世界圍棋大賽中,他均在開始落後的情況下最終逆轉勝出。

李世石的對手是Google 旗下 Deepmind 公司研發的人工智能程式 AlphaGo。去年10月, AlphaGo 曾以5局全勢的姿態,擊敗3屆歐洲圍棋冠軍、二段棋手樊麾。

《自然》雜誌於今年1月刊登的文章解釋,AlphaGo 在蒙地卡羅樹搜索中同時採用2個深度神經網絡,分別是選擇下子的策略神經網絡(Policy Network)及評估選點的價值神經網絡(Value Network);前者負責計算每步棋的走法,後者則負責「想像」、推算可能出現的局面,讓AlphaGo 能高度模擬人腦在下圍棋時憑直覺快速鎖定策略的思維邏輯。此外,工程師們為 Alpha 上載了圍棋高手們超過 3000 萬步的棋步,並讓價值神經網絡進行了高達2000萬次自我對局的訓練,最終才讓 AlphaGo 走上比賽桌。

2
李世石奪得過18次世界賽冠軍,奪冠次數為世界第二,僅次於曾21次奪冠的另一南韓棋手李昌鎬。

聲音

人機大戰本身造成人與機器對立的天然屬性,使其能吸引所有人的目光。但大家容易忽略的是,一切最核心的因素,歸根結底都是人的因素。這裏面重要的不僅僅是人與機器之間的關係,更是人與人之間的關係。

知乎網友高飛龍

李世石的強項是後半盤的翻盤能力,布局則是李世石最差的地方,判斷力也不是太好,這對於 AlphaGo 來說是個重大利好,因為電腦一般來說也是強在後半盤。

中國圍棋職業棋手柯潔

圍棋領域電腦徹底戰勝人腦是必然的命運,唯一不確定的只是時間。但體育的精神更多在於突破自我,所以這不是圍棋的末路,而是新開始。

中國網友

Google的技術人員可以通過李世石過往的上千場正式對局,深入了解他的水平。但李世石,只能通過Alpha Go在五個月前下的那五局棋,來初步推斷新版Alpha Go的水平。因此,李世石面臨信息上的絕對劣勢。

知乎網友斷橋

人工智能已經在最近幾年,成為各家科技公司重點研發的方向,這次人機大戰無疑具有里程碑意義。我對人工智能這麼快就可以達到挑戰圍棋世界冠軍的高度,感到很驚訝,但這次是否就能夠戰勝人類,我個人認為還有點不確定。不過,任何事情都有第一次,就像當年深藍第一次挑戰卡斯帕羅夫沒有取得成功,多年後智慧型機器人肯定會崛起。

創新工場董事長兼CEO李開復

AlphaGo 其中一個令人驚異之處是它極度似人,樊麾就曾說過,他當初根本不知道對手不是人,它那種模仿人類「直覺下棋」的方式可以說是技驚四座。但這可能正正是AlphaGo這次的致命傷,因為這種植根於過去人類動作的「風格」,在面對九段高手時,可能會顯得欠缺創意。

Nature 雜誌編輯 Tanguy Chouard

李世石

1983年出生,韓國圍棋九段棋手,成長於韓國全羅南道偏僻的飛禽島,所以又被稱為「飛禽島少年」。早年棋風鋭利,擅長大規模的攻殺,成績卓越,近年來隨着年紀漸長與技術逐漸成熟,開始轉變為全能棋風,能攻能守,剛柔並濟成為一代棋界巨匠。李世石厲害之處在於他下棋的風格飄渺靈幻,時常有神來之筆,兼有強大的戰力且計算極為精準。同時他也有着高水準的心理質素,世界大賽上常在落後的情況下迎頭趕上逆轉拿下勝局。在2005到2010年期間與中國的圍棋第一人古力九段有多次交鋒,受到很大注意。(資料來自維基百科)

圍棋

圍棋是一種策略性棋類,使用格狀棋盤及黑白二色棋子進行對弈。起源於中國,中國古時有「弈」、「碁」(「棋」的異體字)、「手談」等多種稱謂,屬琴棋書畫四藝之一。其西方名稱「go」,係源自日文「碁」的發音。對弈雙方在棋盤網格的交叉點上交替放置黑色和白色的棋子。[2]落子完畢後,棋子不能移動。對弈過程中圍地吃子,以所圍「地」的大小決定勝負。圍棋規則簡潔而優雅,西洋棋大師伊曼紐·拉斯克稱讚說:「如果在宇宙中的其他地方存在智慧生命形式,他們幾乎肯定會下圍棋。」與此同時,圍棋被認為是目前世界上最複雜的棋盤遊戲之一,其複雜度已於1978年被Robertson與Munro證明為PSPACE-hard。合法位置數約2.08×10170。截至2015年7月,國際圍棋聯盟共擁有75個成員國和5個協會會員。(資料來自維基百科)

來源:衞報中央通訊社新浪體育Nature關鍵評論網

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。

延伸閱讀