在汽車行業,行人檢測一直是一個研究熱點與難點。
自動駕駛對於行人檢測的準確性要求極高,行人姿態變化、衣著打扮、隨機運動甚至室外光線等問題都會影響到檢測的準確性。
使用高精度的傳感器有利於算法結果準確,但高精度的傳感器非常昂貴,成本和精度無法兼得,這種矛盾在過去一直很難解決。
相比之下,使用廉價的攝像機獲取圖像,通過處理圖像來檢測到行人的位置以及運動趨勢,從而取代雷達,壓縮成本,該過程就是行人檢測技術。
目前為止,面向智慧交通的行人檢測技術已經取得了不少的成就,本文將從行為檢測的技術構成、主要分類及特點等方向進行簡要闡述。
行人檢測的主要特點
在自動駕駛中,行人檢測主要是指對車載攝像設備獲取的實時視頻進行檢測,通過獲取行人的相關信息來輔助車輛自動行駛的相關技術。
行人檢測與一般的目標檢測存在著較大差異,大多數目標檢測方法並不完全適用於行人定位,主要原因有以下幾點:
1》小目標行人定位準確度較低。
遠距離成像的行人通常目標較小、分辨率較低,缺乏明顯的特征信息,易受到噪聲影響,因此,檢測算法難以精準定位小目標行人,識別難度較大。
2》行人多姿態的特性導致定位準確度低。
區別於一般的目標檢測,道路行人往往具有多姿態、隨性的特征,此類不確定性會加大算法識別難度。
3》背景影響對檢測的幹擾。
行人檢測受背景影響較大,如光照變化、行人周圍輪廓等幹擾都會直接影響算法定位,從而出現誤判、漏判,加大準確識別難度。
4》目標重疊、遮擋對算法識別的影響。
道路通常會出現人挨人、人擠人現象,這無意加大了識別難度,盡管目前的行人檢測方法已能處理局部遮擋問題,但對於大面積、較嚴重的遮擋問題仍難以解決。
這些問題是行人檢測技術的難點,同時也是目標檢測領域的研究熱點。
在實際應用中,行人檢測系統面臨的是一個開放的環境,要考慮不同的路況、 天氣和光線變化,不僅要具備高實時性,同時也對算法的魯棒性提出較高要求。
隨著圖像處理技術的發展,越來越多的研究人員提出了基於圖像分割、深度學習、混合模態 等行人檢測方法來解決以上問題,這也讓行人檢測技術得到了長足的進步。
圖像分割行人檢測法
顧名思義,圖像分割是將圖像分解為若幹個特定區域,再將這些區域劃為不同的類別,以便提取不同的目標區域。
傳統的行人檢測技術主要依賴於圖像分割法,該方法不僅計算速度快,且節約硬件資源,但該方法易受其他因素幹擾,如背景、遮擋等,對行人檢測的準確度不高。
現階段,有三種基於圖像分割的行人檢測技術應用甚廣,分別為閾值分割檢測法、邊緣分割檢測法和語義分割檢測法。
其中,閾值分割檢測法是最常見的檢測方法,該方法使用圖像灰度特征進行灰度計算,通過設定不同的特征閾值,將圖像中的像素點劃分為若幹類,進而與閾值進行對比來完成分割。
邊緣檢測法則是尋找出圖像的灰度、顏色、肌理等圖像特點忽然改變的地方,從而將其作為圖像邊緣進行分割。
該方法受復雜背景影響較小,對於邊界特征較明顯的行人檢測精度較高。
語義分割檢測法是利用卷積神經網絡對復雜環境進行分割,該方法通常具有較好的檢測精度,穩定性較高。
使用語義分割方法可以使提取到的行人特征更典型,增強模型的泛化能力。
深度學習行人檢測法
相較傳統機器學習檢測方法,基於深度學習的行人檢測方法具備更高的準確率和魯棒性。
近年來,深度學習技術已廣泛應用於各類圖像處理中,非常適用於行人檢測,促進了無人駕駛車輛系統在行人檢測等多個核心領域的發展。
主流的深度學習行人檢測方法可以分為兩類:
1》以區域卷積神經網絡《R-CNN》、快速區域卷積神經網絡《Fast R-CNN》、高速區域卷積神經網絡《Faster R-CNN》為代表的基於候選框的方法。
2》以 YOLO《You Only Look Once》、輕量級目標檢測《Single Shot MultiBox Detector,SSD》為代表的基於回歸的方法。
這兩種方法的差異性在於前者將候選區域的選定和目標邊界框的推理識別放置於兩個完全不同的過程階段中,而後者則是一步到位,省去了網絡訓練和推理計算的復雜性,這也是目前主流的方案都是單階段的主要原因。
未完待續….