首頁 » 科技 » AlphaGo是否代表了人工智能的成功和未來
20160314_56e608dcd0826

AlphaGo是否代表了人工智能的成功和未來

AlphaGo是否代表了人工智能的成功和未來

Google旗下DeepMind的AlphaGo VS. 韓國職業九段圍棋棋手李世石

  歡迎關注“創事記”的微信訂閱號:sinachuangshiji

文/Michael282694

相信在最近幾天時間裡無論是否關注圍棋,只要你是一個擁有基本社交關係的正常青年,一定都被AlphaGo VS. 韓國職業九段圍棋棋手李世石(或李世乭)的重磅對抗新聞刷了無數屏。對陣雙方是Google旗下DeepMind公司[1-2]開發的AlphaGo圍棋人工智能(Artificial Intelligence, AI)程序和韓國乃至世界頂級圍棋高手李世石,DeepMind試圖證明AI科技可以使冰冷的計算機具備人類思考意識,以期未來布局到遊戲、醫療、機器人以及手機等領域從而更好地服務人類;而李世石作為代表人類的一方,則試圖拋開人類的偏見和自負,承擔起捍衛聖杯的義務(當然,勝利一方將獲得$100w美金獎金)。遺憾的是李世石目前已經輸掉了整場比賽,被AlphaGo以3: 0的比分毫無懸念摘下這場天王山之戰的勝果(按照官方賽制規定比賽採用5局3勝制,無論哪一方提前勝出都要下滿5局),現在社交網絡上的風評已經由討論比分幾比幾轉變成討論李世石到底能不能扳回哪怕一城?(創事記註:在13日進行的第四局比賽中,李世石戰勝AlphaGo,獲得了其在本次系列賽的首場勝利。)透過直播甚至能看到比賽期間李世石頻繁搖頭嘆氣,賽前誓言要5: 0血洗AI的豪氣早已不復存在,私下裡還被網民戲謔為“Google高級軟件測試工程師”。

AlphaGo是否代表了人工智能的成功和未來

前三場比賽的比分

如果不出意外,這場比賽將會以人類一方被5: 0的血洗終結並載入AI科技發展史。AlphaGo內部的增強學習機制只會讓其棋藝越來越專業,而且機器不會受情感波動的影響穩定發揮,所以現階段壓力幾乎全撲向李世石一邊,剩下兩局已經不再是輸贏的問題了,這對他旗藝的發揮必然造成影響。

這場比賽為什麼空前受矚?

此役之前,AlphaGo曾以5: 0的大比分輕鬆橫掃歐洲圍棋冠軍樊麾,初步證明了AlphaGo的圍棋“思考”能力已經具備圍棋大師賽水準。按照最新的Elo分數世界排名(http://www.goratings.org/),樊麾以2986分排名世界第513 / 827位,屬於職業二段棋手,而李世石的得分是3520,世界排名第4 / 827(2007-2011年間世界排名第1,近幾年長期盤踞前4狀態),屬於職業九段棋手,幾乎代表了人類圍棋博弈的智慧頂峰,所以這場比賽和1997年IBM的計算機程序“深藍” VS. 加里·卡斯帕羅夫那場國際象棋大賽地位相當。

AlphaGo是否代表了人工智能的成功和未來

Elo分數排名和分佈

從解空間大小來看國際象棋的窮舉解空間只有10^46,而圍棋的窮舉解空間高達10^172,即使窮盡整個宇宙的物質也存不下圍棋的所有可能性(宇宙中的原子總數是10^80),針對每一步落子的棋局分析和剪枝優化判定都比國際象棋複雜得多。很多沒有算法概念的小白一廂情願地認為只要用足夠多的計算資源進行暴力窮舉(brute-force)就能得到最優解,這種心態類似著名的猴子無限定理中所描述的:讓一隻猴子在打字機上隨機地按鍵,當按鍵時間達到無窮時,幾乎必然能夠打出任何給定的文字,比如莎士比亞的全套著作。不過在現實中,猴子打出一篇像樣的文章的概率是零,因為科學家經過反覆試驗后發現,猴子在使用鍵盤時通常會連按某一個鍵或拍擊鍵盤,2003年,某個科學家做了這個實驗,結果打出了5張全是‘S’的紙。最終打出的文字不可能成為一個完整的句子。這是因為現實是非常大的有限,而不是嚴格意義上的無限。

AlphaGo是否代表了人工智能的成功和未來

AlphaGo解空間示意圖

AlphaGo是什麼,有何厲害之處?

通過閱讀AlphaGo發表在《Nature 2016》上的文章Mastering the game of Go with deep neuralnetworks and tree search[3]可以了解到:

Abstract: The game of Go has long been viewed as the most challengingof classic games for artificial intelligence owing to its enormous search spaceand the difficulty of evaluating board positions and moves. Here we introduce a new approach tocomputer Go that uses ‘value networks’ to evaluate board positions and ‘policynetworks’ to select moves. These deep neural networks are trained by a novelcombination of supervised learning from human expert games, and reinforcementlearning from games of self-play. Without any lookahead search, the neuralnetworks play Go at the level of state-of-the-art Monte Carlo tree searchprograms that simulate thousands of random games of self-play. We alsointroduce a new search algorithm that combines Monte Carlo simulation with valueand policy networks. Using this search algorithm, our program AlphaGoachieved a 99.8% winning rate against other Go programs, and defeated the humanEuropean Go champion by 5 games to 0. This is the first time that a computerprogram has defeated a human professional player in the full-sized game of Go,a feat previously thought to be at least a decade away.

AlphaGo是否代表了人工智能的成功和未來

AlphaGo的神經網絡訓練模型和架構

通俗地講,AlphaGo就是一套針對圍棋周密設計的深度學習引擎,採用多種機器學習技術進行整合:增強學習(reinforcement learning),深度神經網絡(deep neural network),走棋網絡(policy network)、快速走子(fast rollout)、估值網絡(Value Network)和蒙特卡洛樹搜索(Monte Carlo tree search, MCTS),加上Google強大的硬件支撐和雲計算資源,結合CPU   GPU,通過增強學習和自我博弈學習不斷提高自身水平[4-5]。值得一提的是,paper兩位主要作者之一的Aja Huang(一名低調的台灣教授,另一位是David Silver)也是一名圍棋愛好者,目前水平已經達到業餘六級(普通人一般是業餘二級),整個AlphaGo主要來自兩位在博士階段及畢業以後五年以上的積累。

在未來,AI科技能否超越人腦?

自1956年AI這個概念被提出並確立以來,一共經歷了符號主義→ 專家系統→ …→ 統計學習→ 神經網絡→ 深度學習等幾大重要階段,尤其是近十年來對深度學習的研究使得AI在歷經神經網絡發展低潮過後再一次空前崛起。回顧過往,歷史上比較著名的AI對抗人類智慧事件共有三次:

1.1997年IBM的計算機程序“深藍”在國際象棋大賽中以3.5: 2.5 (2勝1負3平)戰勝加里·卡斯帕羅夫,當時使用的是人工調整的評估函數,而且是用特殊設計的硬件和“暴力”的搜索。

2.2011 – 2012年,吳恩達(Andrew Y. Ng)在Google Brain搭建了一個擁有1.6萬多個微處理器、數十億連接的神經網絡,通過觀看千萬數量級的YouTube圖像后,無監督地從裡面自主辨識出了“貓”這種生物。然而這樣一個龐大集群卻也只能達到一個幾歲孩子的思維水平。

吳恩達現就職於百度,擔任公司首席科學家,負責百度研究院的領導工作,尤其是Baidu Brain計劃。

3.近期,Google旗下DeepMind的AlphaGo與韓國職業九段圍棋棋手李世石的圍棋對抗,目前比分為AlphaGo: 李世石 = 3: 0,AlphaGo勝。

那麼,若AlphaGo贏下全部五局比賽,是否意味着AI科技進入全面應用的智能生活時代?不盡然也。按照智能程度分類,AI可以分為強人工智能和弱人工智能,強人工智能的觀點是讓機器真正的思考(can machine really think),弱人工智能的觀點是讓機器智能的行動(can machine act intelligent),本質上現有的大多數AI系統包括AlphaGo都還處於弱人工智能階段,人工投入越多,智能的表現就越多,機器只是執行人類複雜程序命令,並不具備類人情感情緒和思維思考。注意到對AI的分類並不是以解空間大小作為標準,像語音 / 圖像搜索、機器翻譯、智能家居和無人駕駛等即將或已投入使用的AI科技的計算體量都比AlphaGo小得多。

谷歌人工智能軟件首贏韓國選手李世石看上去是一座里程碑,它似乎意味着電腦已經能做任何人類所擅長的事,但事實並非如此。世界上還有無數人類能夠完成的任務,是電腦難以接近的。“世界上最強大的力量應當是人類本身,而不是一把鐵鍬或者核潛艇。人類製造的產物不講道德和感情,但他們擁有力量,這種力量的快速增長往往讓人類感到恐懼。”——英國《衛報》

讓電腦模擬出人類思維方式是一件很難的事情,計算機能正常運轉是通過按部就班地執行一行行程序代碼實現,這些代碼指令最終都會變成0和1的二進制機器碼。

l語音搜索

一個簡單的搜索引擎案例,當你想了解黃曉明的家人都有誰時,會在搜索框中輸入“黃曉明的老婆是誰”,結果是Angelbaby,但如果你想繼續了解“黃曉明的媽媽是誰”,就必須重新執行第二次搜索動作才會得到結果。試想一下如果搜索引擎具備了人腦的思維方式,整個過程將會變成:“黃曉明的老婆是誰”→“Angelbaby”→“媽媽呢”→“張素霞”,相當便捷。如果將這種搜索方式以語音的方式交互,省去在小塊手機屏幕上打字輸入的煩惱,對搜索用戶體驗將帶來極大的提升。語音搜索是一種結合多種AI技術的典型應用,包括但不限於語音識別(speech recognition)、自然語言處理(natural language processing, nlp)、機器學習(machine learning, ml)和對數據的挖掘(data minging, dm)和呈現(data visualization),實現過程相對於單一任務、封閉式規則的圍棋項目要複雜許多,可以通過語義理解與多輪對話精準識別你的需求,帶有一定的思考判斷能力。在未來,語音搜索可以應用到例如智能硬件服務、汽車導航助手、基於語音特徵的金融支付、新聞媒體和諮詢顧問等行業中,不排除未來發展成為強人工智能的趨勢。

AlphaGo是否代表了人工智能的成功和未來

具有多輪對話功能的語音搜索

l圖像識別

豐富的社交網絡讓人人自帶媒體屬性,情感在互聯網上被肆意發泄,可以無時無刻分享心情和照片。最近幾年因深度學習被大力推崇與發展,搜索功能也變得不再單一,尤其是語音和圖像搜索識別技術開始大放異彩,無數科學家前後投入希望搜索引擎更加智能地服務用戶。比如哪一天你在朋友圈刷到一張美女明星圖,不追星的你出於對美女的鐘愛也很想知道這是哪位明星以及她的基本資料,只要將圖片保存後上傳到圖像搜索引擎中分析識別,計算機會幫你找到想知道的信息。

AlphaGo是否代表了人工智能的成功和未來

基於海量數據的圖像識別

除此之外,還有基於人臉、姿態和場景等綜合的相似性圖像推送。

AlphaGo是否代表了人工智能的成功和未來

基於海量數據的相似圖片推送

l機器翻譯

語言是溝通的橋樑。在沒有中間翻譯的條件下,兩個不同語種的人交流往往十分困難。近年來伴隨着語音識別和深度神經網絡(DNN)等技術的快速發展和經濟全球化的需求,多語言機器翻譯研究成為當今信息處理領域新的研究熱點。基於深度學習的翻譯系統的核心是一個擁有無數結點(神經元)的深度神經網絡,一種語言的句子被向量化之後,在網絡中層層傳遞,轉化為計算機可以“理解”的表示形式,再經過多層複雜的傳導運算,生成另一種語言的譯文。

AlphaGo是否代表了人工智能的成功和未來

機器翻譯演示

以目前的發展趨勢預測,AI替代人類部分工作只是時間問題,這在眾多領域已經初現端倪。最後引用開復老師的精彩答案[6]來回答:戰勝李世石的AlphaGo是否代表了人工智能的成功和未來?

1.在可以憑邏輯分析推算的問題上,機器即將遠遠把人類拋在後面。機器速度會越來越快,學習能力會越來越強,數據會越來越多。當年,大家討論“國際象棋輸給機器不算什麼,圍棋才是真正的智慧”只是我們人類維護自己尊嚴但是不實際的幻想!今天,我們該面對現實了!

2.在大數據機器學習大規模并行計算的時代,我們將看到無數的商機和產品,能夠在預測、分析、推薦等方面,產生巨大的商業和用戶價值。不過,這些解決方案和人類相比,其實沒有什麼意義,因為人差太遠了(比如說:推薦引擎將能推薦你最可能會買的產品、想吃的菜,想認識的人;自動交易能得到更高的投資回報和風險比例。。。)。

3.在感知方面,人類也將會被機器超越。今天的語音識別,人臉識別,未來的自動駕駛,都是例子。

4.但是,以上都還是冷冰冰的技術,機器打敗了世界冠軍也沒有感到高興(甚至說不出為什麼)。對於那些科幻片的粉絲們:機器人是否會人性化?這還是未知的。畢竟,在情感、喜怒哀樂、七情六慾、人文藝術、美和愛、價值觀等方面,機器離人還差的很遠,甚至連基礎都沒有。對人工智能的研究者,這是下一個挑戰。對我們人類,在下個突破之前,我們還是多發展右腦吧!

參考資料

1.DeepMind:https://deepmind.com/alpha-go.html

2.DeepMindOffical Blog:http://googleresearch.blogspot.sg/2016/01/alphago-mastering-ancient-game-of-go.html

3.《Mastering the game of Go with deep neural networks and treesearch》:http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html,百度雲分享:http://pan.baidu.com/s/1nuyNtk1

4.《AlphaGo的分析》:http://zhuanlan.zhihu.com/yuandong/20607684

5.《AlphaGo究竟是如何打敗人類“最強圍棋大腦”的?一篇論文告訴你答案》:http://mp.weixin.qq.com/s?__biz=MjM5NTU0MTAzNQ==&mid=404106659&idx=1&sn=fb3fa527ab3c9ddac5bc7bba2771e6fb&scene=1&srcid=03139nyzbOCFFr8wEH0seGeA#wechat_redirect

6.《李世石能戰勝 AlphaGo 嗎?》——李開復的回答:https://www.zhihu.com/question/39906815/answer/89652546

作者簡介:Michael282694,知乎互聯網領域小V,寫得一手好代碼,吐得一手好嘈。

AlphaGo是否代表了人工智能的成功和未來

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

看看這個吧

20160413_570dcdddbebff

霍金想要探測比鄰星,有可能成功嗎?

  歡迎關注“創事記”的微信訂 ...

9iNe-fxrcizu4067037

蘋果購地以時光女神命名 疑有關電動汽車項目

蘋果新大樓以古希臘“時光女神” ...