首頁 » 科技 » 霍金門徒:計算機如何比人更懂世界

霍金門徒:計算機如何比人更懂世界

  新浪科技 王若涵

  12月20日的上海,寒氣襲人,在虹橋吳中路1189號的五樓會議室,站在一塊投影屏和白板之間的Alan Yuille教授,手托腮,若有所思。在他面前的是慕名而來、經過遴選的來自清華、浙大高校具有計算機相關背景的40多名學生。因為Alan教授在霍金的指導下獲得了理論物理博士學位,同時又是計算機視覺領域頂級學者。

  在他的學生Leo Zhu(朱瓏,依圖科技創始人)的邀請下,他不遠萬里來到中國,開啟為期兩天的計算機視覺課程。Alan教授有着滿頭的銀絲、深陷的眼眶和蒼白的面容,看上去就像個普通的白人老者,但卻在知識的深度和廣度上異於常人—擁有數學、理論物理、計算機、心理學、精神病學和生物行為學等領域深厚的研究背景。

  此後,Alan教授開始將興趣轉向人工智能,主要鑽研其分支領域計算機視覺(Computer Vision),先後就職於MIT人工智能實驗室、哈佛大學計算機系,現任職於UCLA統計系,也是UCLA視覺識別與機器學習中心主任。三十年來,Alan教授涉足計算機視覺的學術和產業界,成為了首屈一指的專家。

  而此次來華,Alan教授一方面是為了向中國學生普及計算機視覺知識和行業現狀,另一方面也是為了支持其學生Leo的創業項目“依圖”—專註於視覺理解的初創公司,提供基於圖像理解的信息獲取和人機交互的產品,致力於構建機器視覺的未來。

  由木見林看世界

  什麼是計算機視覺?Alan教授在兩天的課程中都講了什麼?在應用層面,計算機視覺技術能用來做什麼?

  簡單來說,計算機視覺是賦予計算機和人一般處理視覺信息的認知能力,即製造有人類視覺能力的機器,讓計算機通過學習算法接近人類對圖像的理解程度,對明顯的視覺信息進行深度分析。而當計算機實現了對圖像和視頻的初始理解,計算機視覺就能幫助人類突破局限性,改善生活。

  不同於計算機,人類一睜眼就能迅速看到和看明白一個場景,因為人的大腦皮層至少有一半以上海量神經元參與了視覺任務的完成。而計算機和人腦則是在極為不同的物理或生物限制下進行運轉,即便說計算機視覺理想狀態要更接近人類智慧,但在控制環境中,計算機系統能夠比人類更好地完成某項明確任務。

  計算機視覺的開放性任務一般包括物體檢測、人臉識別、人類行為識別和場景理解。這也是依圖正在試圖通過技術應用解決的任務。而物體識別是計算機視覺研究的核心議題,不過當計算機沒有學習,不知道看什麼的時候,顯然並不能看懂什麼,所以需要一套系統教會計算機識別物體。

  在傳統物體識別系統中,當計算機嘗試研究一個特殊類型的數碼圖像時,會首先檢測圖片的顯著特徵,即Alan教授課堂上講述的邊緣檢測(Edge Detaction)和圖像分割(Image Segmentation)。假設系統需要識別人臉,就會查看眼睛、鼻子和嘴巴等器官的邊緣部分,然後確定它們之間的空間位置。

  這意味着,處理數以萬計物體的計算機系統將會變得不可控制的龐大。每當計算機系統庫中加入一個新的物體,計算機就需要從頭開始確定物體的重要部分。而物體雖然具有固有組成部分,但不同角度物體看上去又有所不同,所以計算機需要不斷檢視邊緣確定空間位置,從而佔用了大量存儲。

  而Alan教授和Leo Zhu於2010年採用新的方法解決了上述問題。他們研發的新系統通過遞歸式塔狀結構來表示物體的結構—系統不需要事先被告知物體的哪些特徵需要尋找,會先判定細微細節,由低層次的結構組合成稍微複雜的形狀,再辨別稍複雜形狀如何組合成為更高層次部分,組裝成一個塔式結構,而最高一層則代表整個物體的模型。

  基於研究成果,Leo Zhu意識到計算機視覺逐漸達到了從理論轉化到應用層面的階段,未來幾年將進入技術爆發時期。2012年,他萌生了回國創業的想法。

  “依圖”的機器視覺

  Leo Zhu在取得導師Alan教授的支持后,與多年好友林晨曦(前阿里雲技術總監,ACM/ICPC全球大學生程序設計競賽亞洲第一個世界冠軍團隊成員)合作創辦了專註於圖像理解的初創公司“依圖”,並把駐地設在了上海。

  目前,依圖推出的主要應用產品聚焦在人臉識別和物體識別上。雖然人類希望計算機視覺接近人類智慧,不過在人臉識別上,計算機處理能力要高於人類大腦。對於這點,新浪科技有幸在依圖公司體驗了智力被碾壓的過程。

  為了讓小白更好地理解計算機如何進行人臉識別,依圖製作了一款遊戲,共20道題,每道題都選取一個人在真實環境中的頭像照片,讓參與者在五個有着相似相貌的人中選出符合的照片。因為正確選項拍攝角度不同,加上混淆選項何其相似,所以選擇起來異常費力。

  最終實驗結果證明,通過人腦判斷的正確率平均約為50%,而計算機能夠做到90%以上。對於這種虐心遊戲,體驗者紛紛感嘆,對於具有臉盲症的朋友簡直是“治療福音”。不過這只是一個遊戲展示,真正的產品是能夠真實而快速地判定一個人的身份,可用於安防領域。

  在依圖這個高科技公司,門禁系統應用了人臉識別技術,快速匹配一個人的身份。新浪科技觀察到,員工進門前會拿出登記認證過的手機,選取任意角度自拍一張,如果人臉匹配,門會自動打開。依圖還有一個專門的應用展示房間,當每個人靠近門口時,房間內攝像頭掃描到人的存在,會實時鎖定人臉,然後在系統數據庫中檢索人臉圖像進行匹配,這一過程大概只有3到5秒。

  人臉識別的用途範圍很廣,包括公安系統判定犯罪嫌疑人身份、安檢系統確定可疑人員身份等等。目前,依圖的這項技術已經被運用在了江蘇公安系統中,還將擴展到全國其他地區。最初推廣也經歷了一些波折,依圖合伙人林晨曦表示,人們最初都覺得不新鮮,因為人臉識別技術早就應用了,但是在精度上卻並不足夠成熟運用。

  最初Leo Zhu和依圖聯合創人林晨曦擁有機器視覺技術但沒找到行業痛點,所以在推廣中也是逐漸找到了應用場景和方向,早期得到了江蘇省公安系統的認可。傳統的公安局人臉識別準確度大約能做到40%,而車輛識別也僅限於判定車牌,無法精確到品牌、型號、購買時間和車主。 為了解決這個問題,Leo Zhu 和林晨曦首先開始搜集數據量,於是他們發動員工,一起每天在大街上抓拍車輛照片,建立數據庫。

  蘇州市公安局分管科技的副局長技的副局長陳斌華告訴他們:“如果你們車輛的品牌識別能做到70%、車輛能夠判定出型號,我們就考慮使用你們的產品。”對於這個難點,依圖的員工不分晝夜花了三個月時間終於攻克,僅是對桑塔納的識別正確率就超過了90%。

  通過這套“蜻蜓眼”系統,蘇州公安可以準確進行車牌識別和車型識別, 具備了應用計算機自動發現在路面行駛的假套牌車輛的能力,這在全國公安屬於首創。 經過了一年的數據積累和系統改進,原來針對套牌作案車輛需要花至少3到4小時才能完成的甄別工作,現在只需要十多分鐘。

  就在不久前,蘇州公安以此為突破口,迅速摧毀了一個專門盜竊出租車頂燈、計價器的犯罪團伙,極大提高了工作效率。目前,依圖能夠實現對運行中被捕捉在鏡頭中的所有車輛進行品牌、型號、購買時間和車牌號真假的鑒定等。隨後,福建和成都等公安系統也開展了與依圖的合作。

  不過比起人臉識別, 簡單剛性物體識別的技術門檻要相對低一些,因為物體不會像人臉一樣會形成不同角度和不同狀態的形狀扭曲。而在這個難題上,依圖已經做到了在一億人中進行人臉識別靜態比對。

  在人臉識別應用上,依圖與蘇州市局合作開發了靜態人像比對系統。今年7月,依圖將在逃人員照片庫與蘇州公安人像庫進行批量對比,發現25名在蘇州有活動的在逃人員線索信息。目前,青奧會安保系統,珠海航展安保系統也已相繼成功應用了依圖的人臉識別產品。

  依圖的發展方向並不是只開發安防產品,而是創建一個在計算機視覺領域具有國際前沿地位的技術研發平台。未來,依圖還將從人臉和物體識別延展到人的肢體和服飾識別上。比如幫助用戶判定路人甲身上所穿衣服的品牌,而這又要用到增強現實技術,需要軟硬件完美結合。

  對於計算機視覺下一步能夠做什麼,在從業者看來都是未知數,因為技術演進速度超出想象,現在設限並不合適。

  從學術界到產業界

  對於計算機視覺的研究領域,在近五年來都處於快速發展的關鍵階段,學術研究在近兩年得到了巨大進展,而在應用領域在未來一到兩年將進入集中爆發的階段。

  根據美國國家科學基金會白皮書,計算機視覺興起於二十世紀六七十年代,而在進入2010年以來,計算機視覺主要面臨兩個問題,一是由於該領域與計算機、工程學、數學、統計學、心理學與神經學科等有着跨學科緊密聯繫,但受限於領域通是常一種分裂研究的狀態;二是通常該領域的研究是以非結構化的方式進行,故學術界與工業界之間聯繫並不緊密,互動不多。

  在地域上,根據白皮書顯示,1991年計算機視覺研究由美國主導,在歐洲的活動數量有限,在亞洲就更是少之又少。而在過去二十年裡,美國的計算機視覺有穩定的發展,而在歐洲卻發生不容小覷的擴張。近年來,在亞洲更是取得了巨大的突破。很大程度上,亞洲和歐洲在這一領域的發展都是由強大的資金支持推動的。即使在美國,大多數研究者都是非本土出生的。

  而計算機視覺的發展,主要得益於計算機、傳感技術和數學等學科的發展。在計算機視覺專家E·艾德森看來,進步即將發生在於“人們正在學習如何適當使用應用數學與工程解決視覺問題。人們在控制理論、優化問題、信號處理等方面正變得更加擅長。”

  而現在,學術界和工業界的聯繫愈來愈緊密,從理論到現實的差距大為縮小。Alan教授說,特別是這五年來,很多工作越來越實際,美國科技公司比如微軟、Facebook、谷歌亞馬遜百度等,都在人工智能領域做實際工作,“我非常高興看到這些進展,因為我們最後還是希望能夠轉化為實用產品。”

  這也是為何依圖選擇在這個時間點切入從事計算機視覺的應用研究。Leo Zhu表示:“其實沒有人確切知道現實和理論有多大距離,未來兩年技術是比較大的爆發時期,這是我們預見的事情,所以這是我們為什麼要做這個事情。”他說道,“以前大家都知道計算機視覺是未來,但不知道什麼時候會來,但我們有具體意義上的推導,所以決定2012年開始,以及現在正在做這件事。”

  作為Alan教授的學生,Leo Zhu自然具有強硬的學術背景,而他並沒有繼續做研究,而是回國創業。Leo Zhu希望將計算機視覺作為終身事業,但作為學院派研究者只能通過自己的學生傳承知識,而回國創業將理論轉化為實際應用,並推動國內相關領域的發展,是他更傾向於走的一條道路。

  Alan教授說責無旁貸地支持Leo Zhu的選擇:“現在跟十年前不太一樣了。十年前有很多學生要做教授,而過去五年來情況已經變了。我最好的這些學生都想創業,而計算機視覺是一個很好的領域,現在也是一個很好的時機。”他解釋道,過去的學術成果距離解決實際問題還有一定的距離,但近來學術有重大進展,在實際中也將發揮巨大作用。

  Alan教授和霍金

  Alan教授感知到學術界和產業界互相推進的必要性,以及在中國的巨大增長潛力,於是他此次專程來滬與中國學生進行交流。而在兩天的課程中,教授一直處於連續不間斷講課的狀態,他說這也是他第一次長時間授課的經歷。

  不過,儘管Alan教授連續講課口乾舌燥,課間也要接受同學的提問,但是他仍然耐心有加、有條不紊,和藹紳士的態度讓人肅然起敬。而除了計算機視覺的理論框架之外,他還回憶了自己的學術經歷,與學生探討科學研究的方法,以及講述了他在研究生涯的心得體會。

  在師從霍金時候,Alan教授在研究相對論和量子物理,前者是在宏觀範疇中描述結構,而後者則是在微觀中研究。而他是霍金的第二個研究該課題希望統一兩個理論的學生。“這個是有一點抽象的課題,想要把這兩個理論統一到一起,的確是非常難,就算是30年後的今天似乎也沒有人做的特別成功。”

  在接受新浪科技採訪時,Alan教授分享了與導師霍金的一些故事。他說,霍金是一個非常風趣幽默的人,有時會操縱他的輪椅,在房間里轉圈圈玩。平時Alan教授作為學生會和霍金有比較近的聯繫,有時候會幫他做一些事情,包括喂他吃東西之類的。在霍金比較有名了之後,很多科學家都會慕名前來看望他,教授會在旁邊聽,同時也會經常見到他的家人,一起吃午飯和照看他的孩子。

  今年下半年,電影《萬物理論》上映,講述了講述霍金盧伽雷氏症病情發作前的生活與妻子之間的故事。Alan教授說:“這是基於他的太太寫的書,故事看起來都還挺真實的,特別是演霍金的這個演員,長相和聲音和霍金一模一樣,我會覺得,霍金就是在銀屏上面。但是其他的人就不像我認識的人,所以我感到有點奇怪,就像是一群陌生人圍着他在幹些什麼。”說著他笑了起來。

  而今年來,霍金對於人工智能發展也敲了不少警鐘。他警告稱,人類正面臨來自智能技術的威脅,隨着技術體自身開始學會自我思考,並學會適應環境,人類將面對不確定的未來。霍金表示:“如果進一步向前看,技術幾乎是沒有極限的。儘管我們可能正面臨人類歷史上最好或最壞的時代,而我們所有人都應該問問自己,應該做些什麼才能最終趨利避害。”

  對此,在Alan看來:“記得大概30年前,霍金成為盧卡斯物理教授(Lucasian Professor這是愛因斯坦和牛頓都曾有過的一個頭銜)時,他做了一個演講,解決了理論物理以後,結果是機器可能會淘汰這些物理學家。我想霍金可能30年以來都一直有這個顧慮,並不是現在AI(人工智能)的興起才有這個顧慮,或許我下周寫封信問問他這個問題。”

  對於計算機視覺的未來,Alan教授認為,終極目標當然是建立一個智能的系統,能夠像人一樣看懂這個世界,也可能能力上超越人類,比人類更能看懂這個世界。因為大腦神經元主要用來處理視覺,所以通過視覺能夠了解人腦。而未來人類能夠通過計算機更加理解人腦,看懂我們存在的世界。

看看這個吧

霍金想要探測比鄰星,有可能成功嗎?

>>每日更新50片,高清108 ...

蘋果購地以時光女神命名 疑有關電動汽車項目

>>今晚的好伴侶,高清1080 ...