自動駕駛取得突破!上海AI實驗室聯合團隊獲CVPR最佳論文獎。

摘要:為自動駕駛技術與產業發展指出了新方向

自動駕駛取得突破!上海AI實驗室聯合團隊獲CVPR最佳論文獎。

溫哥華當地時間6月21日,2023年國際計算機視覺與模式識別會議《CVPR》公佈了最佳論文等獎項。

上海人工智能實驗室、武漢大學和商湯科技聯合發表的自動駕駛通用模型相關論文從9155篇論文中脫穎而出,獲得本屆CVPR最佳論文獎。

這是近十年來,計算機視覺三大頂級國際會議《CVPR、ICCV、ECCV》上第一篇以中國學術機構作為第一單位的最佳論文。

CVPR在學術界和產業界都有重要影響力。

根據谷歌學術指標2022年列出的全球最有影響力的六大科學期刊/會議中,CVPR位列第四,僅次於《自然》《新英格蘭醫學雜志》《科學》。

入圍本屆CVPR最佳論文候選名單的作品來自谷歌、上海人工智能實驗室、斯坦福大學、康奈爾大學等知名企業和科研機構。

最終,上海人工智能實驗室聯合團隊的研究成果《以路徑規劃為導向的自動駕駛》摘取CVPR 2023最佳論文獎。

這篇論文首次提出感知決策一體化的自動駕駛通用大模型UniAD,開創了以全局任務為目標的自動駕駛大模型架構先河,為自動駕駛技術與產業發展指出了新方向。

UniAD:業界首個感知決策一體化的自動駕駛大模型

上海人工智能實驗室青年科學家李弘揚介紹,作為一種高度復雜的技術,自動駕駛不僅需要多個學科領域的知識和技能,包括傳感器硬件、機器學習、多模態融合等,還需要適應不同國家和地區的道路規則和交通文化,與車輛及行人進行良好的交互。

自動駕駛系統包含三大主任務——感知、預測和規劃。

當前,業界主流的方案架構是分別采用不同的模塊來處理這些任務,但由於各模塊並非以駕駛為最終目標進行優化,自動駕駛系統的整體性能提升受到了很大限制。

在UniAD中,研究人員首次將感知、預測和規劃等三大類主任務、六小類子任務《目標檢測、目標跟蹤、場景建圖、軌跡預測、柵格預測和路徑規劃》整合到統一的基於Transformer的端到端網絡框架下,實現了全棧關鍵任務駕駛通用模型。

在nuScenes真實場景數據集中,UniAD的所有任務均達到『領域最佳性能』《State-of-the-art》,尤其是預測和規劃效果遠超之前的最佳方案。

其中,多目標跟蹤準確率提升20%,車道線預測準確率提升30%,預測運動位移和規劃的誤差分別降低38%和28%。

在晴天直行場景中,UniAD可以感知左前方等待的黑色車輛,預測其未來軌跡《即將左轉駛入自車的車道》,並立即減速以避讓,待黑車駛離後再恢復正常速度直行。

在雨天轉彎場景中,即便面對視野幹擾較大且場景復雜的十字路口,它也能通過分割模塊生成十字路口的整體道路結構,並完成大幅度的左轉。

在夜晚視野變暗的情況下,它能感知到前車並完成先靜止、後左轉的規劃。

本屆CVPR上,上海人工智能實驗室有12篇論文入圍『Highlight《亮點》』名單,覆蓋視覺基礎模型、通才模型、三維視覺、底層視覺、視頻檢索、物體檢測、姿態估計、自動駕駛等相關領域的研究。

其中,UniAD相關工作獲最佳論文獎、三維物體數據集研究工作入圍最佳論文候選。