文/小羿
人機(jī)大戰(zhàn)第二季第一場,柯潔負(fù)于AlphaGo。
結(jié)果并不出人意料,就像人們已經(jīng)習(xí)慣了Master橫掃棋壇一樣。拼盡全力的柯潔,也只能望洋興嘆,AlphaGo對棋的理解和判斷已經(jīng)高于我們(人類)了。
但是,如果我們關(guān)注的僅僅限于輸贏,那整場比賽已經(jīng)沒有任何意義了。網(wǎng)易智能希望帶您深挖圍棋背后的東西,AlphaGo憑什么贏了人類,它顛覆了什么,它以后還會存在嗎?在人工智能技術(shù)大范圍推廣應(yīng)用的今天,人類該何去何從?
柯潔 vs AlphaGo 2.0:一場頂尖高手的精彩較量
雖然我們對于輸贏早已心中有數(shù),但如果我們盡情欣賞這局比賽,一定會為其精彩之處贊嘆不已,F(xiàn)年19歲的柯潔是目前世界排名第一的職業(yè)圍棋選手,5歲開始學(xué)棋,10歲的時(shí)候成為職業(yè)選手,曾先后四次獲得國際大賽冠軍,可以說,他本身就代表了人類在圍棋上的最高智力。而AlphaGo 2.0經(jīng)過進(jìn)化,學(xué)會了的自我博弈,幾乎是滿血+升級。雙方的比賽,在圍棋界就是一場值得載入歷史的空前決賽。
在第一局的比賽中,柯潔對AlphaGo早已有所防備,使用了傳奇圍棋大師吳清源和木谷實(shí)在上世紀(jì)30年代創(chuàng)立的三·3開局。此開局曾經(jīng)流行數(shù)十年,此后在現(xiàn)代圍棋中漸漸淡出。然而,AlphaGo(曾化名Master)在今年1月的一系列比賽中再次啟用此開局,此后柯潔和其他棋手一起在最近的棋賽中令其活力再現(xiàn)。在今天的對局中,AlphaGo還使用了它擅長的二間守角,而柯潔則在左上角祭出了三·3點(diǎn)角。
搜狗CEO王小川曾評論到,這次人機(jī)大戰(zhàn)我們的關(guān)注點(diǎn)不再是機(jī)器是否會贏,而是機(jī)器將用什么姿勢戰(zhàn)勝人類。
14:50分左右,經(jīng)過4個(gè)多小時(shí)的時(shí)間,AlphaGo執(zhí)白以1/4子獲勝。
三角獸科技首席科學(xué)家王寶勛點(diǎn)評說,能比較明顯的感覺到AlphaGo對于“勢”的理解跟之前對戰(zhàn)李世石相比更加明顯了,在這樣的情況下,機(jī)器比人更能避免陷入局部利益的狹隘計(jì)算,進(jìn)而表現(xiàn)為能夠走出看似難以理解但是實(shí)則韻味無窮的落子,因?yàn)樗拿恳徊蕉际浅肢@勝的目標(biāo)前進(jìn)的。
賽后,柯潔表示, “我對布局有過備戰(zhàn)和研究,所以一開局下了三·3占角,三·3點(diǎn)角,這都是對手特別喜歡下的,所以我想看看它怎么應(yīng)對,但它應(yīng)對得非常好。那手?jǐn)嘧屛液苷痼@,這手棋在人類對局中幾乎是不可能的,因?yàn)槭呛笫。后來冷靜下來分析確實(shí)是好棋,制造了很多劫材,同時(shí)讓角部實(shí)地化,一石二鳥。AlphaGo實(shí)在下得太出色,我輸?shù)脹]什么脾氣,很厲害!
一句“輸?shù)脹]脾氣”,讓我們覺得作為人類圍棋冠軍的柯潔,第一次對于打敗自己的人心服口服。
而另一方面,DeepMind創(chuàng)始人Demis Hassabis(哈薩比斯)在賽后新聞發(fā)布會上表示:“我要向柯潔表示祝賀,這是一場精彩絕倫的比賽,雙方勢均力敵,難分高下,對在座的每一個(gè)人來說,都是一次令人激動的體驗(yàn)!
哈薩比斯認(rèn)為,柯潔將AlphaGo推向了極限。
自由自在,這才是圍棋的真諦?
AlphaGo之父哈薩比斯也是一個(gè)絕頂聰明的人,他從4歲開始下象棋,很快成為天才少年。8歲時(shí)就思考人腦如何完成復(fù)雜的任務(wù)。在本場比賽開始前的開幕式上,哈薩比斯就為此次比賽定了調(diào)。他說,“AlphaGo的本質(zhì)是人類利用電腦發(fā)現(xiàn)新知識,人們利用哈勃望遠(yuǎn)鏡發(fā)現(xiàn)新的宇宙空間一樣。就像我們的最終目的不是輸贏,因?yàn)椴还苋绾,最終的勝利終將屬于人類。讓我們一起尋找圍棋的真諦!
啟發(fā)棋手思路,尋找圍棋真諦。哈薩比斯將AlphaGo比喻圍棋界的“哈勃望遠(yuǎn)鏡”,事實(shí)也證明了AlphaGo對于人類圍棋的種種啟發(fā)。
正如賽后柯潔所說,比賽之中AlphaGo的幾個(gè)下法我覺得是人類對弈中不可能發(fā)生的,AlphaGo今年的棋和去年的棋判若兩人,有很多地方值得我們棋手去學(xué)習(xí)和探討!癆lphaGo在沖擊人類的圍棋理念,那就是沒有什么棋是不可以下的!笨聺嵳f。
職業(yè)女子棋手和評論員徐瑩在今天比賽的評述中說到:“自從 AlphaGo 出現(xiàn)之后,突然圍棋變得五彩斑瀾了,我們感覺思路一下子打開了,AlphaGo 這種自由自在的行棋風(fēng)格,恰恰是我們一直所追求的圍棋本質(zhì)。”
Michael Redmond九段點(diǎn)評說,AlphaGo的棋風(fēng)如何激發(fā)人類棋手挑戰(zhàn)創(chuàng)新的邊界,并賦予一些傳統(tǒng)套路新的生命。“柯潔在開局階段就使用了他從早前Master連勝系列中學(xué)習(xí)到的下法,并和自己的風(fēng)格融合到了一起!
正如哈薩比斯所說,“再過一萬年,我們也不能窮盡所有的打法!钡牵瑖宓奶剿鲝奈赐V。
AlphaGo有哪些蛻變,2.0之后何去何從?
哈薩比斯今日透露,目前的AlphaGo是在云端由單TPU運(yùn)行,這與Goolge上周在I/O大會上剛公布的芯片版本一致。TPU是專門為機(jī)器學(xué)習(xí)而設(shè)計(jì)的處理器。與去年3月與李世石的比賽時(shí)相比,當(dāng)前的版本在處理計(jì)算時(shí)所消耗的能量僅為過去的十分之一。
360研究院院長顏水成點(diǎn)評說,過去一年多,AlphaGo在學(xué)習(xí)方式和模型上有很大的變化和提升,實(shí)時(shí)比賽計(jì)算已經(jīng)用一個(gè)TPU就足夠。對于算法上的貢獻(xiàn),三角獸科技首席科學(xué)家王寶勛說,毫無疑問的AlphaGo基于深度學(xué)習(xí)的搜索算法得到了進(jìn)一步的優(yōu)化,走棋的效率更高,強(qiáng)化學(xué)習(xí)勢必比之前發(fā)揮的作用更大。但是Deepmind對于硬件和模型細(xì)節(jié)的把握同樣是不可忽視的因素。
對于AlphaGo 2.0的技術(shù)進(jìn)步,地平線機(jī)器人技術(shù)CEO余凱稱,這次AlphaGo 2.0的重要進(jìn)展是,系統(tǒng)完全從零狀態(tài)開始通過自我博弈來學(xué)習(xí)和提升棋力的。而以前的1.0版本是有學(xué)習(xí)人類棋手歷史數(shù)據(jù)的。這種完全不需要外界數(shù)據(jù)的自我學(xué)習(xí),是人工智能很激動人心的一個(gè)進(jìn)展。
搜狗CEO王小川進(jìn)一步解釋說,AlphaGo 1.0是巧妙地混合了蒙特卡洛樹搜索+監(jiān)督學(xué)習(xí)+增強(qiáng)學(xué)習(xí)三種算法。而此次AlphaGo2.0的技術(shù)原理與之前有著巨大不同,它放棄了放棄了監(jiān)督學(xué)習(xí);放棄了蒙特卡洛樹搜索,不再進(jìn)行暴力計(jì)算;極大地強(qiáng)化了增強(qiáng)學(xué)習(xí)的作用,之前敲邊鼓的算法,正式成為扛把子主力。
第四范式資深機(jī)器學(xué)習(xí)架構(gòu)師涂威威點(diǎn)評到,在底層架構(gòu)上,AlphaGo這一版性能相比去年有了一個(gè)量級的提升,不僅是訓(xùn)練速度提升,而且實(shí)際對弈的機(jī)器也從去年的多臺機(jī)器的集群變成了現(xiàn)在的單機(jī),這點(diǎn)對實(shí)際應(yīng)用意義巨大,降低了使用門檻,同樣也使得在相同計(jì)算資源的情況下,可以支持更多的訓(xùn)練數(shù)據(jù)和維度更高的模型;Google在此之前也宣布了新版的TPU,打破了深度學(xué)習(xí)訓(xùn)練硬件上GPU的壟斷(更早公開的TPU只是被應(yīng)用在深度學(xué)習(xí)預(yù)估系統(tǒng)中),新版的AlphaGo可能也會受益于TPU技術(shù)的進(jìn)步。算法細(xì)節(jié)上尚未公布,這一版可能對搜索策略和強(qiáng)化學(xué)習(xí)一些細(xì)節(jié)上進(jìn)行調(diào)整,比如蒙特卡洛樹搜索和策略網(wǎng)絡(luò)結(jié)合來提升性能,以及上一版的AlphaGo自我博弈的啟發(fā)式策略(與前幾輪的自己進(jìn)行對弈)并不收斂,我們猜測新版可能在這些方面會有所改進(jìn)。
涂威威重點(diǎn)提到,DeepMind已經(jīng)在嘗試讓AlphaGo有“舉一反三”的能力,這種觸類旁通的能力才是人類更為擅長的,這里就要用到遷移學(xué)習(xí)領(lǐng)域的技術(shù)。
對于AlphaGo在比賽之后的發(fā)展,創(chuàng)始人哈薩比斯表示,我們在本周內(nèi)會告訴大家,并披露更多的技術(shù)細(xì)節(jié)。
人工智能能給人類帶來什么?
雖然哈薩比斯沒有透露AlphaGo的去向,但是他在現(xiàn)場曾表示,我們利用人工智能可以解決目前的很多難題,比如醫(yī)療。我們希望AlphaGo與人類的合作可以找到更多的方式,我們希望AlphaGo在其他領(lǐng)域也能取得矚目的成就。
達(dá)闥科技CEO黃曉慶說,AlphaGo贏柯潔是完全在意料之中,贏很小的優(yōu)勢也是意料之中,因?yàn)槟鞘茿lphaGo的設(shè)計(jì)方法,只需要保證贏就行!斑@是對強(qiáng)人工智能技術(shù)的可能性的最強(qiáng)大的證明!”黃曉慶強(qiáng)調(diào)說。
也許就是因?yàn)檫@種進(jìn)步,DeepMind將開始探索人工智能在醫(yī)療等各個(gè)行業(yè)領(lǐng)域的應(yīng)用。
海知智能(ruyi.ai)創(chuàng)始人兼CEO謝殿俠評點(diǎn)說,以AlphaGo為代表的人工智能應(yīng)用,在這場認(rèn)知革命里只是一個(gè)小小里程碑。工業(yè)革命實(shí)現(xiàn)了體力工作自動化解放了體力勞動者,認(rèn)知革命將知識工作自動化解放腦力勞動者。
最后,智能菌相對大家說,比賽尚未結(jié)束,精彩還在繼續(xù),雖然變化打法仍沒有找到AlphaGo的弱點(diǎn),但柯潔仍表示會盡全力去拼每一盤棋,作為觀眾我們何嘗不需要這種認(rèn)真的精神呢?