柯潔還是輸了!

2017 年 5 月 23 日,在舉行於中國烏鎮的「人機終極對決」第一局中,當今世界排名第一的中國圍棋選手柯潔,輸給了 Google 旗下的人工智慧程序 AlphaGo。

按照比賽規則,柯潔和 AlphaGo 各有三個小時的時間;但在現場的比賽中,整體的節奏比預想中的要快很多。尤其是 AlphaGo,它的平均齣子時間為 30 秒左右,現場解說的職業八段棋手張璇和職業九段棋手常昊多次用「高效、果斷」來評價它的表現。而柯潔的應對狀況比較多變,有時會立刻下子,有時也會思考很長時間。

愛范兒(微信 ID:ifanr)在現場注意到,當柯潔用時一個小時的時候,AlphaGo 所用的時間不到二十分鐘。

最終比賽的結果也並不十分出人意料,在比賽進行了四個多小時之後,柯潔九段執黑負於 AlphaGo,AlphaGo 贏四分之一子。

不過,關於這場「人機終結對決」的最終結果,目前還存在一定的變數;今天只是這場對決的第一局,第二局和第三局將分別在 5 月 25 日和 5 月 27 日舉行,愛范兒(微信 ID:ifanr)將保持關注。

關注微信公眾號愛范兒(微信號:ifanr),回復關鍵詞「阿爾法狗」,獲取 AlphaGo 下圍棋的乾貨,了解機器學習和深度學習的區別。

這次的狗,亦敵亦友

就在昨天晚上,柯潔在新浪微博發表了題為《最後的對決》的賽前宣言,不無傷感地提到:

決戰前夕,感慨萬千…
在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸贏,這都將是我與人工智慧最後的三盤對局

這種離別的氣氛,反而給了這次比賽更多「且看且珍惜」的意義。

今天的比賽之後,柯潔還將在 25 日和 27 日進行對 AlphaGo 的后兩盤對決,無論第二局輸贏,三盤比賽都將完成,與之前 1 月份化身 Master 的 AlphaGo 要求下快棋不同,本次比賽採用傳統規則,雙方各有三小時的時間。

直到本次「中國烏鎮·圍棋峰會」,已是 AlphaGo 第三次刷屏,前兩次人機對決的場景還歷歷在目,但整個人類世界對於兩方選手的感情卻發生了顛覆性的變化。

2016 年 3 月,AlphaGo 首次挑戰韓國棋手李世石時,整個世界都希望 AI 獲勝,就像柯潔當時所說,「就算阿法狗贏了李世石,它也贏不了我」,大家以看熱鬧的心態打量著新生者 AI。

而當 2017 年 1 月,化身 Master 的 AlphaGo 在互聯網上連掃世界第一柯潔、韓國冠軍朴廷桓、日本冠軍井山裕太時,AI 似乎已經不可戰勝,柯潔也在微博深夜感慨「人類千年的實戰演練進化,電腦卻告訴我們,人類全都是錯的……」

直到今天,當柯潔在賽前說到「能夠代表人類出戰,是我以前不敢想象的事情,這次選擇我作為主角,我也會竭盡全力去一爭勝負」時,世界的選擇已經變成了希望人類贏一盤。

這種心態在賽制上也有所體現,除了代表中國選手最高水平的柯潔個人之外,新加入的配對賽和團體賽也非常值得關注。

配對賽將由古力、連笑兩位九段當中的一人分別與 AlphaGo 組隊,再與剩下的一人進行對決,每方只有 1 小時時間,比賽在 26 日上午打響

團隊賽則是時越、羋昱廷、唐韋星、陳耀燁和周睿羊 5 位世界冠軍組成人類聯隊,合力對抗 AlphaGo,每方 2 小時 30 分鐘,這將在 26 日下午進行。

當 1 對 1 的對決已經過於殘酷,人機組隊又會擦出怎樣的火花,人類聯合組成的「神經網路」面對 AI 又是否還有勝算呢?

人不是那個人,狗不是那條狗

千萬別以為「坐」在場上對弈的雙方一年來都沒有變過,用很哲學的說法來說,他們都已經不再是當年那個存在。

自從今年 4 月確定了本次人機對決之後,柯潔已經有意識地在尋找對抗 AlphaGo 的「神之一手」,在先前進行的新奧杯世界賽和中國圍甲聯賽中,柯潔在 8 盤比賽中輸掉了兩盤,而這兩盤中出現了一些之前並不常見的運子方法,有觀察者表示這是柯潔在嘗試以傳統套路之外的方法尋找 AlphaGo 的軟肋。

從這個角度講,這三盤比賽中的柯潔的策略或許將與之前完全不同。

(那一年,柯潔的世界排名還在 AlphaGo 前面)

但 AlphaGo,恐怕在以令人絕望的迭代速度進化著。同樣在今年 4 月,AlphaGo 之父哈薩比斯在英國劍橋大學進行了演講,專門提到為了幫助 AlphaGo 提升,他們還開發了名為 Anti-AlphaGo 的防止過擬合的擾亂工具,之前 AlphaGo 提升一個版本需要 3 個月,現在只需要 1 周。

AlphaGo 對陣李世石時的版本號是 V18,而當下的版本估計已經到了 V60,在邏輯上和棋局策略上已經今非昔比。

這種進化的力量源泉與意義,是蒙特卡洛搜索演算法和深度學習模式的不斷進化。

為了解釋上面這兩個似乎每個字都能看懂,但其實都看不懂的詞,我們先來看兩組數字。

如果讀過人工智慧的科普文章的話,一定知道 20 年前的 1996 年 5 月,IBM 的
「深藍」電腦在國際象棋中戰勝了世界排名第一的卡斯帕羅夫。

從數學上考慮,國際象棋棋盤上能夠發生的不同可能大約是 10 的 46 次方,也就是 10000000000000000000000000000000000000000000000。

但這在圍棋面前就是小巫見大巫了,圍棋共有 19X19 個落棋點,加上不同的落字方式,全部可能大約是 10 的 170 次方左右,根據荷蘭科學家 John Tromp 的計算,大約是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。

大家知道,困擾人類很多問題的原因在於算力,比如一個密碼鎖,如果只有兩位,那麼如果忘了密碼很多人都會嘗試去從 00 試驗到 99,但 4 位數的手機密碼就沒幾個人去試了,因為試出來花的時間太長,這就是算力不夠。

對於現在的 AI 來說,對弈國際象棋所需的算力已經基本達到,但是妄圖用窮舉法算出來圍棋的各種可能的算力還沒達到,這種情況下,就要考慮演算法了。

而 AlphaGo,就採取了一種「大智若愚」的辦法,讓算力不足的電腦「大愚若智」起來。

這就是蒙特卡洛搜索演算法,我們明白,很多時候兩人對決,其實不需要每一步都走當時最好的那一招,只要出的招是妙招,或者比對方能想象的好就行。這時候,就是一個概率問題。

舉個非常簡單的例子,從你家到火車站共有 ABCDE 五條路,或許你不知道每條路具體的長度和用時,但此時,如果從你家同時出發 500 人,每條路 100 人,然後你到火車站去觀察,假設半小時內到達的人里,走 B 的最多,你就可以斷定走 B 是條好路。

當然,路越多,路口越多,這種情況的分析會越複雜,但是放出的人越多,結果也會越精確,雖然沒有人能打包票說某條路一定是最對的,但是分析結果足夠做決策了。

這是用最最不嚴謹的方法解釋了這種概率學的取樣方法,但這相比逐項窮舉的辦法,大大前進了一步。

而深度學習,指的是 AlphaGo 會根據之前人類棋手的大量歷史棋局,記錄下每個棋局當中的分步局面,並把當前的棋局按照進行視覺分析,跟以往的數據進行比較,找到最類似的局面,再在當前最高質量的點上去下子,不至於把所有的位置都考慮一遍。

而當下版本 AlphaGo 最駭人之處,在於它已經跳出了學習人類棋盤的方法,而進入了自己左右手互搏,自己學習各種情況的局面,一方面它所學習到的棋局廣度非人類可想象,另一方面它的出招可能越來越沒有「套路」可言。

更別提 AlphaGo 只要有電就可以無休止學習這件事了,由於圍棋本身有明確的規則判斷勝負,所以 AlphaGo 可以在無需人類標註的情況下就能判斷自己出招的好壞,更是強化學習的一大優勢。

現在的狗,是人類智慧和機器智慧的結合體了。

明知不可為而為之,是為了費電么

我預測結果是 0 比 3,AlphaGo 勝出——聶衛平
人類的勝算為 0 ——李開復

既然在比賽層面,已經如此的沒有看點,為什麼人機對抗還要繼續進行呢?

賽前有媒體認為,這是為了向社會繼續推廣 AI 的概念,為行業的發展做宣傳,這種說法雖然都有一定的合理性,但格局未免太小。

就像在手機應用商店中會在「益智遊戲」中找到圍棋一樣,進行這種遊戲的目的還是為了益智。

而進行 AI 於人類的對抗,根本目的還是檢驗和優化演算法,並且力爭在其他更有價值的行業中進行應用。

就像在《智能革命》一書中,李彥宏說的那樣,「2017 年初,AlphaGo 的變身 Master 橫掃中韓頂級高手,一時間人們分化為悲觀派、降臨派、冷靜派、腦洞派……我們希望有更多人是默默學習派」。

從最初的 AlphaGo,到 Master,再到今天的 AlphaGo,三代產品,三段歷程,對應的恰好是「理論,實驗,再創新」的三段論。

而這種基於互聯網大數據的深度學習和決策支持系統,將在很多人類算力不可及的領域提供支撐。

Google 大中華區總裁石博盟就透露,AlphaGo 的第一個結合點會是醫療領域,AI 將在一定準確率的情況下,給予醫生診療判定方面的輔助,對於糖尿病、癌症等疾病的治療和研究大有裨益。

而未來在更大的深度和廣度上,AlphaGo 積累的決策模型,將逐漸把人力從需要反覆的勞動中解放出來,同時對腦力勞動進行反哺,對絕大多數社會元素進行快速解構並解讀,再反饋給人類。

如同去年大熱的科幻片《降臨》一樣,人工智慧與人類本體,終將會找到一條智慧結合的發展大路。

最後,我想以暢銷書《深澤直人》中文譯者路意今早創作的《最後一局人機對弈》當中的一段話做結:

在今年閱讀到 Jacob Bronowski 的 The Ascent of Man 的時候,被他所寫到的生物界中,只有人可以遠離他所誕生的環境,甚至在極端不適合生存的地方生活所啟示,人之所以能夠具備現在的能力,必然是與其敢於離開自己的舒適區有關。而藝術,愛,智商,想象力,創造力…這些似乎都不能是必要條件,而更像是在數十萬年中,人類在不斷抗爭和追尋夢想的過程中所進化出的特質。

 

智能是人可以步入今日之成就的必要條件,但非充分條件。機器智能想必也會如此,大多數是不會具備人的意識的,但是不可排除的是,隨著時間的推移,其中有些會開始覺醒,擁有自我意識,開始抗爭,和追尋夢想,也會有貪嗔痴,真善美。

 

那時,它們自然也可稱之為人。人也不再只限一個血肉之軀。

轉載文章請附上來源:柯潔輸了!人不是那個人,「狗」更不是那個「狗」 – 科技空間 TechRoomage