版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-人工智能是送給世界的禮物

中國科普博覽
原創(chuàng)
中國科協(xié)、中科院攜手“互聯(lián)網(wǎng)+科普”平臺,深耕科普內(nèi)容創(chuàng)作
收藏


圖1 韓國棋院授予AlphaGo名譽(yù)九段證書

1:4,人類負(fù)于機(jī)器。7天之中,人機(jī)對弈激戰(zhàn)五局,終于落下帷幕。
相比之前的四局,第五局顯得波瀾不驚。無論是演播室里的棋手,還是討論技術(shù)的專家,抑或屏幕前的觀眾都能以愉悅的心情觀賞比賽。
李世石九段在取得開局優(yōu)勢后,顯得過于保守。雖然雙方各有失誤,但AlphaGo似乎有著更好的大局觀,終以微弱優(yōu)勢勝出。賽后的新聞發(fā)布會上,李九段說自己感到遺憾,希望以后能給觀眾呈現(xiàn)更強(qiáng)的自己。事實(shí)上,他已經(jīng)通過棋局,給世界呈現(xiàn)了超越勝負(fù)的意義(所謂偉大的棋手,即使是失敗,也能留給世界一些超越勝負(fù)的“遺產(chǎn)”)。比如,比賽剩余的獎(jiǎng)金被捐贈給聯(lián)合國兒童基金會(UNICEF),STEM教育機(jī)構(gòu),以及圍棋慈善機(jī)構(gòu)。
正如比賽解說邁克?雷蒙(九段)所言,AlphaGo團(tuán)隊(duì)和李世石為圍棋界,乃至全世界送來了禮物。這場全新的圍棋比賽,不僅讓愛好圍棋的人們聚集到一起,而且讓全世界的人來關(guān)注這項(xiàng)運(yùn)動,跨越障礙,彼此分享交流。
頒獎(jiǎng)典禮上,韓國棋院的總裁樸治文也提到,他一開始驚訝于人工智能的表現(xiàn),但在思考之后,他相信在未來人類社會中,人工智能可以為社會做出許多貢獻(xiàn)。事實(shí)也證明,由于這場比賽,歐洲和美國以及全世界有更多人的喜歡上了圍棋,圍棋也可以成為一項(xiàng)全球化的活動。東西方棋手之間的對決也會隨之到來。
不僅僅是西方人開始通過圍棋感受到東方文化的精髓,這項(xiàng)高水平的智力運(yùn)動通過人工智能的解讀,也從此有了新的發(fā)現(xiàn)?!扒嗌倌昕梢杂懈玫膰逵?xùn)練變得優(yōu)秀,而國家也會隨之成為優(yōu)秀的國家”。
那么這次比賽對我們來說又是個(gè)什么樣的禮物呢?請看專家點(diǎn)評。
張崢
上海紐約大學(xué)終身教授,紐約大學(xué)庫朗數(shù)學(xué)研究所兼職教授、CILVR實(shí)驗(yàn)室成員,前微軟亞洲研究院副院長。

在戰(zhàn)前,我做過這么一個(gè)含金量為零的預(yù)測:AlphaGo必勝,只是不見得是這一次。隨后的一周,驚心動魄,也不斷被打臉。
隨著戰(zhàn)局的進(jìn)展,各類科普文章不停涌現(xiàn),其中不乏佳作。我來稍稍總結(jié)一下?!肮饭贰笔侨绾螣挸傻模合韧悼?千萬棋譜,站在巨人肩膀,然后左右手互博漲棋力?!肮饭贰毕缕迨且槐祀s的雞尾酒:花相對高的代價(jià)逐個(gè)敲開搜索圖譜,然后幾十條“狗狗”奪門而出,以勝率判斷為指南針,用蠻力一擊到底,閃電般地來回踩踏再凝聚一點(diǎn)——啪,落子。既復(fù)雜,也不復(fù)雜,它把工程和數(shù)學(xué)的結(jié)合達(dá)到了藝術(shù)品的高度;把高度的計(jì)算量壓縮到可以和人對局(甚至用時(shí)更少)。至少對我來說,它在尺度上的大騰挪不比引力波事件差。
然而它還是敗了一局。有個(gè)朋友笑說,這充分說明了狗咬人不是新聞,人咬狗才是。AlphaGo應(yīng)對不正確的勝率估算嚴(yán)重滯后,休克期間昏招連連。很可能是勝率估算出了問題,導(dǎo)致“狗狗”們集體跑錯(cuò)方向;但終極原因,還是因?yàn)檎驹诓荒敲锤叩募绨蛏?。DeepMind的團(tuán)隊(duì)說要清零,把棋譜扔掉,正本清源,重頭開始。這是昏招,更是偉業(yè),希望他們成功!
自覺打臉最重的是,之前我對在棋局之外的人機(jī)交談本不報(bào)任何希望。但現(xiàn)在,我相信,“狗狗”和人類都互相學(xué)習(xí)了很多很多——棋界,學(xué)界,媒體,普羅大眾。表現(xiàn)最為出色的是棋界,不止李世石一人。以勝負(fù)說話,以棋藝為上,黑白之秤牢牢搞定方位,簡單,直接。至于學(xué)界和業(yè)界,我覺得應(yīng)該先認(rèn)清自己的站位:0 - 。為什么是“零減”?先留個(gè)伏筆,以后再慢慢道來。
朱文章
香港科技公司首席架構(gòu)師、香港大學(xué)計(jì)算機(jī)博士、圍棋業(yè)余5段(弈城9段),前微軟及谷歌軟件工程師,iOS軟件“圍棋之眼”作者

第四盤比賽結(jié)束的時(shí)候,讓人類好像經(jīng)歷外星人入侵,把人類英雄踩在腳下,然后血泊中的英雄,瞬間崩發(fā)出神之一手,反戈一擊成功。好萊塢的典型煽情故事。一瞬間,職業(yè)棋手都緩過來了,紛紛發(fā)賀電鄙視阿法哥。
但今天我想用輕松的心情細(xì)細(xì)品味最終一戰(zhàn),立場是支持圍棋棋道,不論勝負(fù),給雙方選手都加油。
李世石今天心態(tài)很放松,可以從開始的時(shí)間控制看出來,李世石的布局也相當(dāng)簡明。到了40,黑棋空多無弱子。

但是我感覺,白棋像道策??吹啦哌@盤,是不是幾分神似?

黑棋左邊31的靠,記得是吳清源大師提倡過的簡明手段。大道至簡,也許這是圍棋的最高境界。
阿法哥右下就讓人鄙視了。業(yè)余棋手都能看清的手段,硬是自己下死,花了代價(jià)學(xué)會了“大頭鬼”這個(gè)圍棋手段。我預(yù)感,如果阿法哥輸了,它會受到各方職業(yè)棋手的鄙視?!鞍l(fā)力點(diǎn)根本不對啦,根本不會下棋”。
70手是阿法哥卓越的中腹感覺,黑棋下得有點(diǎn)保守,最后三目活。應(yīng)該是心理出現(xiàn)波動,想贏怕輸。解說的麥克雷蒙這時(shí)冒出一句話:李世石估計(jì)在想,前三盤是怎么會輸給那么low的阿法哥啊。此時(shí),局面已經(jīng)很細(xì)微了,甚至白棋潛力巨大。

阿法哥下到第100手,第三局的大師風(fēng)采又來了。黑棋得拼搏了。但是中間弱棋還沒治理,只能揮師左下。還好,阿法哥慈悲,放黑棋從二路爬回。轉(zhuǎn)而亮出136手的小阿飛刀。
還有一個(gè)看點(diǎn),就是阿法哥今天也進(jìn)入讀秒,但是發(fā)型沒亂。最終,如果要點(diǎn)目,是白勝2.5目,即1又1/4子。
整盤棋,李世石開局順利,但是沒有繃緊,下得過于放松??磥?,人都是逼出來的。生于憂患 ,死于安樂。
順便總結(jié)下五盤棋。這五盤,基本上我都第一時(shí)間觀看。第一盤,李世石惜敗,本來有機(jī)會。第二盤,阿法哥下出很多好手,五路尖沖,還有中后盤碾壓式的計(jì)算能力,該它贏。第三盤,阿法哥玄妙莫測的棋風(fēng),酷似吳清源,前半盤50手就已經(jīng)把李世石擊倒。但是后面有瑕疵,暴露了局部計(jì)算不能找到正解的弱點(diǎn)。第四盤,李世石心態(tài)好,布局策略正確,打散穩(wěn)住,但中盤冒進(jìn)轉(zhuǎn)換后落后,之后中腹在極度困難的情況下發(fā)出神之一手,阿法哥應(yīng)對失誤,被人類KO。也是第一次看到阿法哥認(rèn)輸?shù)臉幼?。第五局,布局李世石簡明領(lǐng)先,布局策略對頭。中腹戰(zhàn)斗患得患失,最終失利。
這一次比賽,無論勝負(fù),都是棋道的勝利。吳清源說過他200歲之后要在宇宙中下棋。冥冥之中,我覺得他真的來了。借此,致敬吳清源棋圣。
衛(wèi)泓泰
知乎圍棋專欄主持人、圍棋業(yè)余5段

這五盤棋進(jìn)行的時(shí)間是我不斷學(xué)習(xí)提高的過程,新事物的強(qiáng)烈沖擊果然是人學(xué)習(xí)的重要?jiǎng)恿碓础?br /> 前四盤講完以后還有很多人問,棋牌上人工智能贏了不是很正常么,為什么要和舉重機(jī)比力氣和計(jì)算器比算數(shù)和人工智能比數(shù)據(jù)分析呢?
因?yàn)楝F(xiàn)在的計(jì)算機(jī)其實(shí)和人類一樣,并沒有辦法窮盡圍棋里復(fù)雜的變化。人學(xué)圍棋的方法是大量的積累棋譜庫和鍛煉計(jì)算力,比賽的時(shí)候根據(jù)經(jīng)驗(yàn)計(jì)算,在一定情緒氛圍內(nèi),用邏輯進(jìn)行判斷之后做出決策。AlphaGo是什么樣呢,他的本質(zhì)是大量的隨機(jī)落子,總結(jié)哪些勝率高,然后把局部特征總結(jié)出來備用最后與估值網(wǎng)絡(luò)的判斷結(jié)合分別評分之后落子。
本次比賽的看點(diǎn)之一是依靠勝率分析而沒有邏輯判斷的系統(tǒng),和人的邏輯判斷為主的系統(tǒng)優(yōu)劣如何。
五局比賽對于李九段來說,壓力顯然非比尋常。作為人類一方的代表,被關(guān)注的程度和比賽的意義或許超過了任何一次世界大賽。且不說激烈的關(guān)注程度,還有攝像頭無時(shí)無刻的追蹤拍攝,在這種情況下李世石九段頑強(qiáng)拼搏的斗志相信會被廣大棋迷銘記。
這次比賽完以后,很多棋手表示看到了圍棋更迷人的地方。而在圍棋技術(shù)上,AlphaGo帶來了更為廣闊清晰地思路,提供了更好的訓(xùn)練方法和判斷參考。相信Google在圍棋上的探索只是小小一方面,這次比賽給人工智能賺足了眼球,期待Google之后的大招。
下面重點(diǎn)講講棋局,感覺這盤棋李九段已經(jīng)基本回到正常狀態(tài),最后一盤已經(jīng)很放得開,十分精彩。AlphaGo經(jīng)營全局的水平很高,像是打太極,從不起殺心,非常均衡。其看點(diǎn)在于控制與均衡。
之前的開局,Alphago喜歡使用一些古老的套路和自創(chuàng)的招法,這盤棋難得的使用了比較新的流行變化。第一次看到,覺得AlphaGo很有活力。

進(jìn)行到這里是第一個(gè)分歧,如果“退”是平穩(wěn)的下法,如果“點(diǎn)”或者“夾“擊則進(jìn)入戰(zhàn)斗。

這里李九段稍作猶豫,馬上點(diǎn)入,這里是其典型風(fēng)格。進(jìn)行到下圖,黑棋右下實(shí)地很大,稍可滿意。

AlphaGo這步棋,利用右下氣緊,李九段反其道而行之,沖一個(gè),非常有意思。實(shí)戰(zhàn)的結(jié)果來看,局部李九段獲利很大,這種局部計(jì)算AlphaGo還是有問題。不過從之后的運(yùn)轉(zhuǎn)來看,損失卻有限。

初學(xué)的棋友要注意了,實(shí)戰(zhàn)AlphaGo被迫給大家演示了一下:被著名手筋大頭鬼吃掉是什么樣子。

最近幾盤AlphaGo總會走肩沖,李九段使出斗轉(zhuǎn)星移,以彼之道還施彼身??上П话灼宸存?zhèn)一個(gè),這局部最后落了下風(fēng)。

進(jìn)行到這里,黑棋上面只活了三目,所得甚少,相比之下右上白棋模樣有近五十目的潛力,白花花一片,這種控制全局的能力,還是AlphaGo強(qiáng)大。

托很有爭議,局后很多意見仍然傾向于走簡單的點(diǎn)三三。實(shí)戰(zhàn)結(jié)果一二路混合爬過,影響到了中央的厚薄,感覺并不好。

這盤進(jìn)行到收官,AlphaGo又是大量如134送吃的棋,感覺很奇怪。

收官時(shí)最后的轉(zhuǎn)換,按照陳耀燁九段的說法,最后結(jié)果可能黑棋稍虧。之后黑棋官子稍有所得,但是微細(xì)的差距中AlphaGo最后沒有給李九段機(jī)會。
這一盤雙方都出錯(cuò)了,相比之下,AlphaGo明顯的錯(cuò)誤反而更多一些,很多時(shí)候我們都是這樣,贏了開心慶祝,總結(jié)勝招;輸了反躬自省,各種不對。對人的成長來說,勝利的甜頭固然重要,不過在大的趨勢面前,用長遠(yuǎn)的視角去分析去看自己該站的位置更為重要。即使這次李世石九段贏了,總有一天我們會敗在不斷完善的算法上,對于圍棋界來說這一天可能來的比預(yù)想的早太多太多,但對于國際象棋等等棋類,十年前就在思考這樣的問題了。
勝固欣然,敗亦可喜。有些思考的價(jià)值始終超越于勝負(fù)之上,超越于變化本身,神經(jīng)網(wǎng)絡(luò)幾十年前就有,到如今才初得大成。很多人喜歡簇?fù)碓邗r花簇?fù)恚畸愄没实膱鏊凶冯S潮流和一個(gè)又一個(gè)熱點(diǎn)。越是這樣飛速發(fā)展,不斷變化的時(shí)代,越需要寧靜致遠(yuǎn),清晰冷靜的大局觀,不論是在棋盤上還是在人生中。

內(nèi)容資源由項(xiàng)目單位提供