首頁 » 科技 » 圍棋人機大戰,本質是新舊信息模式之爭

圍棋人機大戰,本質是新舊信息模式之爭

圍棋人機大戰,本質是新舊信息模式之爭

  歡迎關注“創事記”的微信訂閱號:sinachuangshiji

  文/何曉陽

  一、人類早已停止進化

  45 億年前,銀河系獵戶旋臂的一個偏遠角落裡,在一顆黃色 G2 型恆星的引力場內,一顆岩質行星慢慢凝聚成型,在隨後的時間裡,在這顆行星的海洋里,元素們慢慢匯聚,開始形成一些複雜的大分子,又過了很久很久,有一類碳元素形成的大分子具備了自我複製的能力,生命由此產生。在隨後的億萬年的時間裡,生命以多種多樣的形式存在,隨着環境的不停變化,這顆名為地球的行星上的生命形態也隨之變得不同,後人給這種生命形態的變化方式起了一個名字,叫做進化。進化使得生命總是能夠更好的適應環境,使得強者的基因能夠淘汰弱者的基因流傳下去,進化論的根基牢牢的扎在量子力學之上,成為主宰這個星球所有生命的唯一法則。

  7 萬年前,一個新的被稱為智人的物種被進化出來,智人憑藉無與倫比的大腦,以智謀和武力橫掃了一切與之競爭的物種,坐上了統治整個星球的王者寶座。智人發明了勞動的分工,可以養活更多的個體,智人這個物種的個體數量越來越多,地球上的智人數量數以十億計,即使是沒有勞動能力的智人也可以生存下去,從此之後,進化戛然而止。雖然進化論依然在發揮作用,但進化樹的頂端已經被智人牢牢把持。智人種群繁衍開來后,由於智人自身 DNA 不再進化,取而代之的智人種族社會進步,則是由認知和文化來驅動。沒有人知道這意味着什麼,這並不是一個有意識的選擇,然而,整個宇宙以及智慧的歷史進入了新的紀元。

  二、未來早已到來,只是尚未平均分佈

  1821年,倫敦。

  清晨,大霧瀰漫在城中的每一個角落,從店裡的窗戶向外看去,一切都是模模糊糊的,只能看到一個輪廓。這家店的牆上掛了一個牌子,牌子用粉筆歪歪扭扭的寫着幾個大字:提取者。下面還有幾行小字,大意是,本店是一家靈異俱樂部,專門討論超自然智慧是否存在,本店有一套專門的規則判斷參與者精神是否正常,最後是落款,本店的店主,查爾斯·巴貝奇。

  巴貝奇一直趴在牆角的一張桌子上打瞌睡,他的數學家朋友赫歇爾坐在他旁邊的椅子上,正在計算一些複雜的對數表格。突然,巴貝奇從睡夢中醒來,激動的抓住了赫歇爾的袖子,“我在想,你的這些表格或許可以用蒸汽機來計算”。

  蒸汽,在當時是一切發動機的驅動力,是一切工業得以運行的條件。在短短的幾十年間,這個詞就成了動力、力量以及一切蓬勃、現代的事物的代名詞。巴貝奇並沒有停留在空想的階段,他雄心勃勃的立刻開始動手建造他的機器,他給機器取名叫做差分機,巴貝奇相信,差分機一旦完工,必將會產生重要影響,不僅會影響到科學的發展,甚至會影響到文明的進程。

  從 1823 年開始建造差分機,到 1942 年終止的時候,巴貝奇不但造出了差分機,而且設計出了下一代機器也就是分析機的雛形,不僅如此,他還請求詩人拜倫的女兒奧古斯塔。愛達。拜倫,給他的分析機編寫程序,愛達。拜倫是歷史上第一個程序員。巴貝奇死後,人們漸漸遺忘了他,巴貝奇在世界發明史上默默無聞,直到很久之後,他才又被重新發現,其重要意義得到追認。巴貝奇在電力甚至都尚未出現的時候,已經看到了未來計算機時代的曙光。

  100 年後,威廉·吉布森專門為他寫了一本小說,名字就叫做《差分機》,這本書後來成為了蒸汽朋克小說的鼻祖,書中有一句膾炙人口的經典名句:

  未來早已到來,只是尚未平均分佈。

  巴貝奇早於其他地球上的人類 200 多年看到了未來的碎片。

  三、人類是一個個孤立的個體

  2016 年 3 月 10 日下午,AlphaGo 對陣李世石,人機大戰第二局。

  我堵在八達嶺高速的滾滾車流中,一邊跟着前車以龜速挪動,一邊聽着鬥魚上面的直播。雖然我對圍棋是一點也不懂,一盤也沒下過,但我並不太擔心,我知道這種賽事解說的安排,有一方代表專業人士負責解讀選手行為並判斷比賽走勢,比如古力;有一個說話比較直懂得比較少的一方的小白,比如這次解說中的兩位女士,負責提一些弱智問題。比較特殊的是,這次還有計算機領域的專家也參與了直播。聽着聽着,我有一些想法漸漸浮上心頭,我發現主要是古力和女解說在講,而計算機專家則一直沉默。古力去形容落子位置的時候喜歡用專有名詞,比如沖、斷、扳、爬、飛等,妹子解說則負責插科打諢,那位計算機專家只說了這麼幾句話,“運行在本地的只是 Agent 程序,AlphaGo 的 Server 是雲端的分佈式的系統,這也代表着未來一種廣泛的趨勢,比如自動駕駛。。。”,然後他的話就被打算了,然後他再也沒有說話的機會。

  我腦海中閃過了三個念頭

  第一,人們對於自己所熟悉的東西會形成模式化的思維,比如對落子的位置形成沖、斷、扳、爬等概念和定義,再比如說,“我是肯定不會這麼下的”。而在不熟悉這些概念的新手眼中,這些定義是無厘頭和荒謬的,是不可理解的。

  第二,人們會把自己的概念套用到對方的行為之上,比如對計算機的落子也都叫做沖、斷、扳、爬等,彷彿 AlphaGo 對於圍棋也有這些概念一樣。

  第三,不同的人之間有深深的認知的鴻溝,計算機科學家和棋手之間基本上無法相互理解,而我這個畫面外的聽眾則同時無法理解這兩類人。

  四、整體大於部分之和

  2016 年 3 月 12 日人機大戰第三局,AlphaGo 執白 176 手中盤戰勝李世石,以 3:0 的比分提前取得了對人類的勝利。

  這一局李世石敗得最慘,早早就被 AlphaGo 妙手擊潰,整盤毫無機會。最後李世石悲壯的造劫,但 AlphaGo 贏得了劫爭,同時也粉碎了 AlphaGo 不會打劫的謠言。這一局 AlphaGo 的表現出的水平是三局中最高的,幾乎沒有一手棋是能被人質疑的,全是好招。看完這三局,圍棋界差不多都絕望了,原來以為是 5:0 的人,現在差不多全都倒向 0:5 了。這個歷程就像《三體》小說中的人類對戰水滴,開局前信心滿滿,一場戰鬥下來人類全隊全滅,整體陷入悲觀失望。

  李世石的賽后感言是:我不知道該說什麼,我覺得我應該先表達歉意,我應該有更好的結果,我很抱歉沒能滿足很多人的期待,我覺得很無力。重頭回顧這三局比賽,第一局,即使重頭來下,我也覺得沒法贏,我從一開始錯誤估計了它的實力;第二局,局面一開始的確曾經按我的意圖走,但很多機會我錯過了;第三局,我已經對 AlphaGo 的風格有所了解,但我從未承受過如此大的壓力。我輸了這些比賽,但身為人類棋手代表,心理因素總會有所影響。希望大家繼續關注第四局的進展。

  從李世石的感言中看,我不確定這段話有多少是他比賽當時的感受,但首先我覺得,李世石這三盤棋輸得並不冤枉。《孫子·謀攻篇》:“知彼知己,百戰不殆;不知彼而知己,一勝一負;不知彼,不知己,每戰必殆。現在的結果是每戰必殆,是不是說明了我們人類在對抗AI的時候是不知彼也不知己呢?

  先說說知彼。

  卡斯帕羅夫曾以國際象棋世界冠軍的身份,在上一次人機大戰中與 IBM “深藍”對戰,那次人機大戰以卡斯帕羅夫的失敗告終。賽后,卡斯帕羅夫說,我感覺不到它是電腦棋,不能說像人。電腦的概念是個很死的東西。但他的思維模式很靈活。同時,下棋時你感覺這種交流很生硬,很冷冰冰。你感覺不到他怎麼想,他也不在乎你怎麼想,這個很厲害。他跟你的交流是很局限的。所以它不算是機器,也不算是人,是兩者之間的一個東西。

  人類最好把卡斯帕羅夫感覺到的他當成是人類之外的另外一種智慧。但是我覺得至少目前並非如此,我們人類對於這種新出現的智能,態度是一如既往的傲慢,我們在談論 AlphaGo 的時候,我們一直在談論它的蒙特卡洛搜索以及深層卷積神經網絡,而不是談論這些東西之上的那個整體,我們對待自己的智慧則從未如此,沒有一個人被考察過神經元軸突和樹突的數量和質量優秀與否。我們總喜歡用我們自己的標準來衡量智慧,而不是去思考智慧的本身應該是什麼。

  我們人類研究智慧如何產生的學科是複雜系統學,複雜系統試圖解釋,在不存在中央控制的情況下,大量簡單個體如何自行組織成能夠產生模式、處理信息甚至能夠進化和學習的整體。我們的大腦是一個複雜系統,神經元之間的連接讓人類具有了智慧,神經元的活動以及神經元群的連接模式決定了感知、思維、情感和意識;昆蟲群落是一個複雜系統,單個的昆蟲雖然行為非常簡單,但是社會性昆蟲群落卻具有驚人的智能。例如,一個蟻群可能由數百隻乃至上百萬隻螞蟻組成,單隻螞蟻相對簡單,它們受遺傳天性驅使尋找食物,對蟻群中其他螞蟻釋放的化學信號作出簡單反應,然而蟻群的社會卻複雜得驚人,它們使用泥土、樹葉和小樹枝建造出極為穩固的巢穴,巢穴中有宏大的通道網絡,蟻群的育嬰室溫暖而乾爽,溫度由腐爛的巢穴材料和螞蟻自身的身體控制。AlphaGo 的智能原理和我們人類大腦的根本原理並無不同,AlphaGo 本質上是由深度神經網絡算法驅動的機器學習,和大腦一樣,都是由極端簡單的個體通過傳遞信息來達到總體上複雜的效果。

  所以,我覺得 AlphaGo 和人的大腦,以及蟻群等本質在存在着共性,都屬於複雜系統。第一,它們都屬於由簡單個體組成的大規模網絡,個體遵循相對簡單的規則,不存在中央控制或領導者,大量個體的集體行為產生出了複雜、不斷變化而且難以預測的行為模式。第二,所有這些複雜系統都是利用內部和外部環境中的信息和信號,這些系統也產生信息和信號。第三,所有這些系統都通過學習和進化的過程進行適應,即改變自身的行為以增加生存或成功的機會。複雜系統和個體之間的行為模式有着根本的不同,從大量個體的連接之上,智慧得以湧現。用一句簡單的話來總結:整體大於部分之和。

  我一直對大量機器所相連接所組成的雲心存恐懼,因為人的智能本質是通過萬億個微小的腦細胞以及它們的電和化學通訊所湧現出來的,而人工智能的本質也是通過神經網絡湧現出來的,但是我們人類之間無法再行連接,而人工智能可以連接的規模則是近乎無窮無盡。我不知道這條路的盡頭是不是天網或者是Matrix。

  五、AlphaGo 和李世石的 PK,本質是模因和基因之爭

  再說說知己的問題。

  最近有不少人在 AlphaGo 面前秀優越感,比如說很多人說機器沒有情感,再比如王垠同學,寫了一篇文章,表示 AlphaGo 雖然下棋下的好,但是很多小事做不了,比如端茶倒水。王垠說,讓機器來給你倒水,是意想不到的難,機器需要作出很多判斷,哪裡是茶壺哪裡是水杯,又需要作出許多控制,來完成倒水的動作。王垠同時感嘆,這些事情人類做起來確實易如反掌,被人類自己視為瑣事。完成這些人類看起來很容易而對機器很難的能力,已經根植於人類的DNA 之中,同時,王垠說,人類的眼睛等器官相對於機器的攝像頭而言,是一種異常先進的設備。要說王垠比起那些在機器人面前秀情感的還是高出一籌,畢竟他說到了根本,人類目前能成為地球的主人,關鍵就在於我們在漫長的進化過程中,我們的每一個祖先已經在我們的 DNA 中內置了非常多的能力,而且我們也已經在漫長的進化中進化出了眼睛這樣無比精巧的器官。

  但是,這兩點背後不是沒有隱患,這也是我說我們人類沒有那麼了解自己的原因。我們雖然在 DNA 中內置了很多能力,我們 DNA 內置了觸覺、聽覺、視覺、嗅覺、味覺,但是同樣,還有很多能力我們是沒有辦法通過直覺直接得到的,並且,我們人類的很多東西是隨着漫長的進化統統都放到 DNA 裡面的,這裡不僅僅是有用的,而且還有很多有害的東西,畢竟很多東西的產生是為了適應當時的環境,而現在,環境已經發生了根本性的改變。

  我們每一個人類都是經典物理學家,我們知道需要多快的奔跑速度才能避開猛獸的追擊,我們知道需要多大的力量才能投擲出長矛;同時,我們又都是古典化學家,我們知道酸和甜的東西是能夠吃的,而苦的東西最好不要吃。這些能力都已經內置於我們的 DNA 之中。我們可以通過近距離的接觸來感知外界物質原子和分子層的運動,這種感覺被我們抽象成冷和熱,我們甚至能夠感知到金屬元素外層電子的不同排布,這種感覺被我們抽象成粗糙或光滑;我們能夠感知到頻率在一定範圍內的聲波和電磁波,我們甚至自大到把我們能夠感知的電磁波說成是可見光,好像這些頻率的電磁波與其他電磁波有本質區別一樣。

圍棋人機大戰,本質是新舊信息模式之爭

  在智人之前,雖然總有種種生物稱霸地球,但基因才是這個世界真正的主宰,基因操控生物做出種種行為。在智人之後,基因退居次席,信息更多的是以概念、文化的方式出現,以脫離基因的方式在整個世界傳遞和延展,但由於信息載體本身的脆弱性(比如焚書坑儒),基因所代表的信息傳遞方式同等重要。在最近的 100 年,模因(meme)取代基因成為信息傳遞的主要方式,而我們人類的直覺觀念則對於這些信息完全失效了。我們無法感知到量子以及不確定性,我們無法感知到蜷縮到微觀的高維空間,我們無法感知到 10^361 到底有多大,我們也無法感知到概率到底是什麼,我們的基因無法傳遞這些信息,而這些信息通過計算機在網絡上以光速傳播。就像第二場直播的時候那位博士所說的那樣,未來的世界,本質是 Agent 加上 Server(enviroment) 的方式存在。

  一切皆信息,人和機器的競爭本質是信息的競爭,同時,又是信息存儲和計算最優方式的競爭,誠然,面對機器,我們的 DNA 中攜帶的信息依然有優勢,但是我們已經失去了我們最強有力的武器,這個武器叫做進化。自從認知革命以來人類創造的所有信息,都是屬於存儲於模因之中,而模因之中的信息,則是人類和機器所共享。我們得到這些信息用了七萬年的時間,而計算機只用了不到七十年,如今我們的優勢,就是存在於我們的基因之中的信息,但我們基因中總的信息量有多少呢?

  全部人類基因組約有 30 億的鹼基對,信息量總和是 2.91 Gbp,約有 39000 多個基因。我們為什麼知道得這麼清楚呢?是因為我們人類啟動了一個人類基因組計劃,打算用計算機分析清楚人類所有的基因及其作用。我不太清楚計算機分析完這些信息需要多久,總之我覺得留給我們的時間不多了。

圍棋人機大戰,本質是新舊信息模式之爭

  六 我們還有什麼武器?

  在弗諾·文奇的小說《深淵上的火》中,一批人類在曾經出現過超級智慧文明的銀河系邊緣空間發現了一個遺留的數據庫系統,這些人類開始利用這些信息做研究,沒想到觸發了一個超級智慧的蘇醒,這個超級智慧被人類稱為瘟疫,瘟疫毀滅了一個又一個的人類文明,但幸好,超級智慧本身在蘇醒的時候,瘟疫內部的反制措施也被喚醒,最終,一個叫做范。紐文的人類拯救了世界。

  我們要想掌握局面,誰會是我們地球人類的范·紐文?而什麼是我們能夠利用的反制措施?我們是不是可以在可能會出現智慧的程序內部植入一些反制措施?這些反制措施就像《黑客帝國》中 Matrix 對人類所做的那樣,監控着一切信息的流動,但這些反制措施也是 Agent 加上 Server 的模式,我們又怎麼能知道,這些反制措施不會成為另外一個天網或者 Matrix 呢?

[email protected]

  本文的全部構思完成於 14 年初的一個晚上,我和幾個寫代碼的同事從 Matrix Partners 開完會回公司,路上在大排檔擼串喝啤酒,我們在討論我們做的 APM 未來會如何,本質上說,APM 是一種在 Application 內部植入二進制代碼,從而監視程序運行是否如人類所想的東東,我腦洞大開,聲稱 APM 是未來人類取得和 AI對抗勝利的唯一武器,但也有可能會成為 AI 的一部分。我是沒想到居然能有機會把這麼扯的東西寫出來,更沒想到會這麼快。

圍棋人機大戰,本質是新舊信息模式之爭

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

看看這個吧

霍金想要探測比鄰星,有可能成功嗎?

  歡迎關注“創事記”的微信訂 ...

蘋果購地以時光女神命名 疑有關電動汽車項目

蘋果新大樓以古希臘“時光女神” ...