柯潔:一度覺(jué)得沒(méi)法繼續(xù)了的棋,很艱苦贏了下來(lái)

  導(dǎo)讀:在柯潔眼里,柯潔苦贏戰(zhàn)勝?lài)錋I“符合預(yù)期”是度覺(jué)得沒(méi)要比贏得LG杯冠軍更值得慶祝的事,畢竟自從AlphaGo去年3月份贏了李世石后,法繼深圳南山約美女上門(mén)提供高端外圍女真實(shí)安排vx《1662-044-1662》提供外圍女上門(mén)服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)人類(lèi)就沒(méi)有在這項(xiàng)古老的續(xù)的下技藝上取勝過(guò)。

  柯潔輸了,棋艱柯潔又贏了。柯潔苦贏

  排名第一的度覺(jué)得沒(méi)柯潔九段大意失荊州,在11月16日的法繼第22屆LG杯世界棋王賽半決賽上,意外輸給日本七冠王井山裕太九段,續(xù)的下再度無(wú)緣LG杯決賽。棋艱

  不知道是柯潔苦贏不是受到了今年5月份在烏鎮(zhèn)輸給AlphaGo的“魔力”,今年以來(lái),度覺(jué)得沒(méi)深圳南山約美女上門(mén)提供高端外圍女真實(shí)安排vx《1662-044-1662》提供外圍女上門(mén)服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)柯潔已經(jīng)無(wú)緣春蘭杯、法繼三星杯、續(xù)的下LG杯三大賽的棋艱冠軍。

  但這似乎并沒(méi)有影響到柯潔的心情。

  11月18日凌晨零點(diǎn)剛過(guò),柯潔發(fā)了一條微博,稱(chēng)他終結(jié)了一個(gè)昵稱(chēng)叫“符合預(yù)期”的圍棋AI的41連勝,“一度覺(jué)得沒(méi)法繼續(xù)了的棋,很艱苦贏了下來(lái)。”

  柯潔認(rèn)為“符合預(yù)期”的實(shí)力在去年戰(zhàn)勝李世石的AlphaGo之上,顯然是想說(shuō),我贏得沒(méi)有水分。他還發(fā)出了一個(gè)世紀(jì)之問(wèn):“若是當(dāng)初第一個(gè)與AlphaGo對(duì)弈的人是我?結(jié)果到底會(huì)是如何?今夜未成眠……”


  顯然,在柯潔眼里,戰(zhàn)勝?lài)錋I“符合預(yù)期”是要比贏得LG杯冠軍更值得慶祝的事,畢竟自從AlphaGo去年3月份贏了李世石后,人類(lèi)就沒(méi)有在這項(xiàng)古老的技藝上取勝過(guò)。

  2017年1月初,披著Master馬甲的AlphaGo一路過(guò)五關(guān)斬六將,干掉樸廷桓、元晟溱、柯潔、聶衛(wèi)平等一眾世界頂尖圍棋高手,豪取59連勝后,在電腦上幽幽地飄出一句話(huà):“我是AlphaGo的黃博士。”全世界都陷入了哀嚎。隨后Master又毫無(wú)懸念地贏了古力,以60勝0負(fù)收?qǐng)觥?br>
  然后就是今年5月23日在烏鎮(zhèn)舉行的世紀(jì)之戰(zhàn),世界排名第一的柯潔對(duì)戰(zhàn)AlphaGo。第一盤(pán)在耗時(shí)4小時(shí)25分后,柯潔以四分之一子敗給了AlphaGo。

  聶衛(wèi)平表示這還是“AlphaGo一再退讓的結(jié)果”,柯潔說(shuō):“我很早就知道自己要輸1/4子,AlphaGo每步棋都是勻速,在最后單官階段也是如此,所以我就有時(shí)間點(diǎn)目,看清自己輸1/4子,所以只好苦笑。感覺(jué)AlphaGo和去年判若兩人,當(dāng)時(shí)覺(jué)得他的棋很接近人,現(xiàn)在感覺(jué)越來(lái)越像圍棋上帝。”

  5月25日,第二盤(pán),柯潔執(zhí)白再次輸給了AlphaGo,盤(pán)面上大龍橫死,只是這次輸?shù)每於嗔恕?br>
  5月27日,柯潔在第三盤(pán)還是輸了,他哭了。在認(rèn)輸之后,他起身走到宣傳板后沒(méi)有攝像機(jī)鏡頭的區(qū)域獨(dú)自流淚,哭得像個(gè)孩子。

  后來(lái),AlphaGo獲得了九段稱(chēng)號(hào),但隨后從世界排名中停留了一段時(shí)間后“被消失”了。

  就在我們都以為AlphaGo就此收手時(shí),10月19日,DeepMind團(tuán)隊(duì)在 Nature 上發(fā)表了題為 Mastering the game of Go without human knowledge 的重磅論文,稱(chēng)新一代的AlphaGo Zero,完全從零開(kāi)始,不需要任何歷史棋譜的指引,更不需要參考人類(lèi)任何的先驗(yàn)知識(shí),完全靠自己一個(gè)人強(qiáng)化學(xué)習(xí)(Reinforcement learning)和參悟,以100:0的成績(jī)戰(zhàn)勝了AlphaGo。

  作為AlphaGo的主要設(shè)計(jì)者之一,也是AlphaGo的“人肉臂”,Deepmind資深研究員的黃士杰日前在臺(tái)灣中研院舉辦的“2017年人工智慧年會(huì)”上談到了AlphaGo的幾次比賽,談到AlphaGo Zero時(shí),他說(shuō):“什么是AlphaGo Zero?我們拿掉所有人類(lèi)對(duì)圍棋的知識(shí),只喂AlphaGo Zero圍棋規(guī)則,讓它自己學(xué)習(xí)下棋。”

  “AlphaGo的成功就是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的勝利,因?yàn)閮烧呓Y(jié)合在一起,建構(gòu)判斷形式的價(jià)值網(wǎng)絡(luò)(Value Network),后來(lái)也成為AlphaGo Zero的主要理論。”黃世杰說(shuō),“AlphaGo Zero是從亂下開(kāi)始,找出圍棋的下法,它只用了三天,走過(guò)了人類(lèi)研究圍棋的千年歷程。”

  據(jù)悉,只經(jīng)過(guò)了40天的訓(xùn)練,AlphaGo Zero就超越了Master。

  在人類(lèi)已經(jīng)絕無(wú)可能贏下圍棋AI的時(shí)候,柯潔在前一天輸?shù)鬖G杯、輸給同類(lèi)后,他反而贏了圍棋AI“符合預(yù)期”,并終結(jié)了后者的41連勝,可以說(shuō)非常戲劇性。

  大概此時(shí)人們都在好奇這位“符合預(yù)期”是誰(shuí)家的AI吧?

知識(shí)
上一篇:直擊現(xiàn)場(chǎng)!《云海之下》正在2024ChinaJoy的“開(kāi)擺之路”竟遭受攔路虎
下一篇:爭(zhēng)當(dāng)風(fēng)云人物!《劍俠天下:收源》“江湖名俠”開(kāi)啟報(bào)名