首頁 » 科技 » 谷歌利用機器學習幫助無人駕駛汽車識別行人

谷歌利用機器學習幫助無人駕駛汽車識別行人

谷歌利用機器學習幫助無人駕駛汽車識別行人

  雷鋒網曾報道,谷歌的無人駕駛汽車已經能出門行駛了,但該車的許多技術卻從未公佈於眾。最近,在西雅圖舉辦的IEEE國際機器人與自動化大會(ICRA)上,與會者們見到一種新的安全設備,該設備十分難得一見,目前正由科技巨頭谷歌研發。

  Anelia Angelova是谷歌的一名高級研究員,從事計算機視覺和機器學習的研發工作。她展示了一種新的行人檢測系統,該系統可單獨處理視頻影像。對於任何無人駕駛汽車來說,能識別,追蹤和躲避行人是一項十分重要的功能。谷歌的車輛上就裝滿了激光雷達,無線電探測器和攝像機,以確保他們能夠確定在數百米範圍內的行人情況。

  但一套感應器十分昂貴,光車頂上的一個旋轉激光雷達裝置就要花費將近10000美元(如果是多功能裝置則花費得更多)。雷鋒網此前也專門分解過無人駕駛汽車的成本。如果自動汽車僅使用廉價的攝像機就能定位行人的話,這將大大降低成本,並且將有希望很快迎來一個機器自由操控汽車的時代。但攝像機有他們自己的問題。Angelova說到,“相較於雷達裝置,視覺信息給你一個更廣闊的視野,但處理速度卻相對較慢。”

  至少它曾經是這樣的。最好的視頻分析系統使用的是深層神經網絡,這種機器學習算法可以被訓練,從而能對圖像信息(和其他類型的數據)進行十分準確的分類。深層神經網絡依靠多個處理層,這些處理層位於輸入層和輸出層之間。為了進行圖像識別,輸入層會學習圖像的像素特徵,下一層則要學習這些功能的組合,並通過中間層,逐漸形成更加精密複雜的關係。輸出層則負責推測系統在關注些什麼。

  現代深層網絡可以在諸如人臉識別等任務方面勝人一籌,準確率超過99.5%。但Angelova解釋道,傳統的用於行人檢測的深層網絡速度很慢,它將每個街道圖像劃分為100000個甚至更多的小碎片,然後反過來對每個碎片進行分析。這可能需要幾秒鐘甚至幾分鐘每幀,使他們無法用於城市街道的巡視。使用這種網絡的汽車無法對行人進行及時的探測,可能在它發現行人的時候就已經超了過去。

谷歌利用機器學習幫助無人駕駛汽車識別行人

  Angelova的新型高速行人檢測器分為三個單獨的階段。

  -第一階段是一種深層網絡,相較於之前的成千上萬的碎片而言,它只需將圖像信息分割成幾十塊碎片,可在多個地點同時進行多項檢測,從而對行人進行識別。

  -第二個階段則是另一種網絡,它能對識別結果進行改良。

  -第三階段則是一種傳統的深層網絡,它將最終識別結果,即是否發現行人,進行傳送。

  由於這種緩慢準確的網絡只對潛在圖像的一小部分進行分析,所以整個處理過程就會進行得更快,大約要比之前的網絡快60到100倍。Angelova說道,這些圖形處理器的運行和谷歌的無人駕駛汽車十分類似,會對大約一天以內的街道圖像進行反饋。然後,它可以在大約0.25秒左右的時間準確地識別行人。研究人員使用已知的行人圖像數據庫,而不是使用谷歌汽車的視頻,因為這樣他們可以將該結果同之前的網絡進行比較。

  Angelova承認:“事實上,目前還達不到能用於實際的0.07秒。”為了能安全採取行動,無人駕駛汽車需要在瞬間確認是否面對行人。“但這意味着倘若其他感應器失靈,新系統能做出及時的補充處理。”

  隨着更強大的處理器的出現以及神經網絡容量的增加,Angelova預計該功能的效果將會顯著提升。她說:“從更加廣闊的視角來看待網絡,你將能感受到更加快速的發展。”等到大家都能擁有無人駕駛汽車時,其獨特的旋轉激光雷達可能已經完全消失了。(張馳)

看看這個吧

霍金想要探測比鄰星,有可能成功嗎?

>>每日更新50片,高清108 ...

蘋果購地以時光女神命名 疑有關電動汽車項目

>>每日更新50片,高清108 ...