無人駕駛進入汽車領域以來,一直無法消除汽車上安裝輔助系統對道路障礙的識別盲區。
2005年,中國科學院自動化所復雜系統管理與控制國家重點實驗室主任王飛躍提出平行駕駛的概念。這一概念針對自動駕駛構建其社會—信息—物理系統模型,從人與車、車與環境、人與車與環境等多個不同層次考慮自動駕駛的實現,并獨特性地提出使用云端駕駛與地面端駕駛“平行”的方式,指導無人車實現智能駕駛,為未來無人駕駛指明了一種新的實現途徑。
日前,王飛躍帶領團隊在《中國圖像圖形學報》發表了一篇關于平行視覺感知技術的文章,提出將人工社會(Artificial societies)、計算實驗(Computational experiments)和平行執行(Parallel execution)構成的ACP方法引入智能駕駛的視覺感知領域,解決了視覺模型合理訓練和評估問題,有助于智能駕駛進一步走向實際應用。
視覺感知努力向人眼看齊
與依靠后視鏡作為輔助的早期汽車相比,現代汽車早已經被攝像頭、毫米波雷達、超聲波雷達以及激光雷達等負責感知的智能傳感器“武裝”起來。“相比于雷達,視覺感知的智能之處體現在紋理信息提取和分辨率上。”王飛躍在接受《中國科學報》采訪時解釋道。智能駕駛需要對復雜的交通環境進行準確感知,其中就包括對交通標志、車道線等進行識別,這些交通要素的識別嚴重依賴色彩信息,而視覺感知可以有效地實現對這些目標的識別和判斷,目前的雷達技術則無法做到。
不僅如此,“視覺感知提取的紋理信息還能夠對同一類別的不同實例進行區分,有助于完成復雜環境下的目標跟蹤、軌跡預測等任務。”王飛躍表示。此外,視覺感知能夠以較低成本構建高分辨率圖像,因此即使是對遠處目標和較小目標,視覺感知方案依然能夠保證有較多的信息來對其進行識別,從而大大提升車輛對環境的智慧感知能力。
論文結果顯示,目標檢測的訓練階段虛實混合數據最高精度可達60.9%,同時精度受到環境與困難程度的影響。
“盡管我們認為在智能駕駛中視覺感知可以類比為人眼的一部分,它可以像人眼一樣獲取外界的視覺信息,但是目前還無法做到像人類強大視覺系統一樣進行推理。”王飛躍坦言。為此,他舉了個例子,比如在復雜城市道路環境中的交叉路口或者人行道上,人類可以根據當前環境推理其他車輛或者行人意圖,并可以與其他車輛或者行人交互并根據情況禮讓,而這一點,目前的視覺感知系統無法做到。“因為視覺感知是通過車載攝像頭或雷達對自動駕駛汽車周圍環境數據進行收集,利用計算機視覺為代表的深度學習技術,對收集到的數據進行圖像識別、圖像分類,并對有價值的信息進行檢測、跟蹤,將其處理成自動駕駛系統能夠讀懂的語言,進而為控制決策系統提供依據。”
視覺感知是智能駕駛核心
在這項研究中,研究人員將視覺感知應用到“長尾場景”中。該場景主要涉及日常駕駛中出現概率極低、很少遇到的復雜挑戰場景,如極端惡劣天氣、突發交通事故、突然出現的行人等。
“由于長尾場景發生概率極低且危險系數高,往往難以采集到相應數據來訓練和測試視覺模型,導致目前基于深度學習的視覺算法沒有經過充分測試,只在簡單的受約束環境下有效。一旦運用到實際復雜開放的交通環境中,算法很容易失敗。”王飛躍說,因此,研究人員希望用平行視覺來解決這一問題,目標是實現一種“長尾常規化”模式,通過人工虛擬場景來仿真模擬復雜的實際場景,利用計算實驗進行視覺模型的訓練與評估,最后借助虛實互動的平行執行實現視覺模型的在線優化。
“這個過程反復閉環迭代,我們希望實現視覺系統對復雜環境的智能感知與理解,讓視覺感知真正走向實際應用。”王飛躍表示。
智能駕駛中的“馬糞”問題
早在2005年,王飛躍就提出了平行駕駛的概念。為了解釋這一概念,他曾在一次演講中以馬車舉例。上世紀末,馬作為主要的交通工具,隨之而來的卻是無法分解的馬糞。這一問題困擾了人們很多年,甚至有專門的國際會議來研究當時面臨的“馬糞危機”。
汽車的到來,成功地消除了馬糞的問題。而在人工智能時代,即便給車輛安裝高線束激光雷達等傳感器感知,配上“足夠算力”的計算單元,優化算法,將汽車改裝成繁雜的智能體,仍無法避免無人車在長久時間內不出現事故。“這就像是這個時代人類面臨的馬糞問題。”王飛躍說,“有人駕駛、遠程控制、網絡車和無人車需要統一起來,成為平行駕駛,根除無人駕駛的‘馬糞問題’。如果一定要將這幾種因素分開,恐怕就是用馬車技術解決馬糞問題。”
在平行駕駛中,視覺感知作為基礎環節,處于智能駕駛車輛與外界環境信息交互的關鍵位置。王飛躍認為,其關鍵在于使智能駕駛車輛更好地模擬人類駕駛員的感知能力,從而理解自身和周邊的駕駛態勢。而隨著自動駕駛中人為干預度的不斷減小,視覺感知獲取環境信息的全面性、準確性和高效性要求越來越高,其始終屬于智能駕駛的核心部分。
他同時解釋道,當前視覺感知依賴相機系統實現對環境的感知,在實際任務中會產生大量冗余的數據,從而導致計算復雜度和存儲負擔的增加、計算效率降低。“平行視覺則更加主動,基于描述學習構建軟件定義的具有可控性的人工場景、基于預測學習完成人工場景中的計算實驗、基于平行執行實現虛實互動,以解決虛擬與現實差異性問題。”
目前,王飛躍團隊采用Agent建模方法,模擬北京中關村區域和常熟智能車測試區域,在圖形學工作站上建立人工場景,設計豐富典型的環境條件和目標運動,生成大量帶詳細標注信息的圖像視頻數據集。同時,部分研究工作采用生成式對抗網絡聚焦于虛實交互過程中存在的領域遷移等問題,并生成了具有真實駕駛場景紋理和細節的合成圖像。“現在,視覺感知已經從道路感知逐步向環境認知方向發展。它已成功應用于識別交通信號、道路標志和標線等靜態環境信息,以及行人、車輛和其他移動的障礙物。接下來,將會進一步理解道路目標之間的交互關系和邏輯,進行意圖分析、預測和決策,有效提升無人駕駛車輛的智能認知能力。”王飛躍說,“隨著深度學習技術的進步和推廣應用,對車載感知計算平臺的性能有了更高要求,將來會在保證算力的情況下降低計算成本。”
“上述成果讓我們有信心布局平行視覺方法在中國智能車未來挑戰賽上的應用。平行視覺是平行智能體系的重要一環,結合平行駕駛、平行測試和平行學習等重要理論研究,智能車先在人工世界試開,‘要在人工世界吃多塹,物理世界長多智’。”王飛躍有信心地表示。(袁一雪)
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
上一篇:小心,你正在被AI看穿