·該論文提出了首個感知決策一體化的端到端自動駕駛大模型UniAD,開創了以全局任務為目標的自動駕駛大模型架構先河,標志著自動駕駛技術的重要突破。
在UniAD中,多目標跟蹤準確率超越最佳性能20%,車道線預測準確率提升30%,預測運動位移和規劃的誤差分別降低38%和28%。
·這是近十年中國學術機構作為第一單位首次獲CVPR最佳論文獎。
論文由上海AI實驗室、武漢大學及商湯科技聯合撰寫。
在晴天直行場景中,UniAD可感知左前方等待的黑色車輛,預測其未來軌跡,並立即減速以避讓,待黑車駛離後再恢復正常速度直行。
6月21日,全球人工智能和計算機視覺領域頂級國際會議CVPR2023《IEEE Conference on Computer Vision and Pattern Recognition》在加拿大溫哥華正式公佈獎項。
上海人工智能實驗室、武漢大學及商湯科技聯合論文《以路徑規劃為導向的自動駕駛》《Planning-oriented Autonomous Driving,UniAD》獲最佳論文獎。
這是近十年中國學術機構作為第一單位首次獲CVPR最佳論文獎。
該論文提出了首個感知決策一體化的端到端自動駕駛大模型,開創了以全局任務為目標的自動駕駛大模型架構先河,標志著自動駕駛技術的重要突破。
一年一度的CVPR是計算機視覺領域的頂級會議。
2023年,CVPR大會的論文投稿總量9155篇,其中2359篇論文被接收,接收率25.78%。
而此次獲獎論文是CVPR歷史上第一篇以自動駕駛為主題的最佳論文,該論文首次提出感知決策一體化的自動駕駛通用大模型UniAD,能夠更好協助行車規劃。
在雨天轉彎場景中,面對視野幹擾較大且場景復雜的十字路口,UniAD能通過分割模塊生成十字路口的整體道路結構,完成大幅度左轉。
自動駕駛是一個高度復雜的技術體系,不僅需要多個學科領域的知識和技能,包括傳感器硬件、機器學習、多模態融合等內容,還需要適應不同國家與地區的道路規則和交通文化,與車輛及行人進行良好交互,以實現高度的可靠性和安全性。
自動駕駛系統包含三大主任務:感知、預測和規劃。
當前,業界主流的方案架構分別采用不同的模塊來處理這些具體任務,但由於各模塊並非以駕駛為最終目標進行優化,因而自動駕駛系統的整體性能提升受到限制。
在夜晚視野變暗情況下,UniAD能感知到前車,並完成先靜止、後左轉的規劃。
在UniAD中,研究人員首次將感知、預測和規劃等三大類主任務、六小類子任務《目標檢測、目標跟蹤、場景建圖、軌跡預測、柵格預測和路徑規劃》整合到一個基於Transformer的端到端網絡框架下,實現了全棧關鍵任務駕駛通用模型。
在nuScenes真實場景數據集下,UniAD的所有任務均達到領域最佳性能《State-of-the-art,SOTA》,尤其是預測和規劃效果遠超此前最佳方案。
其中,多目標跟蹤準確率超越SOTA 20%,車道線預測準確率提升30%,預測運動位移和規劃的誤差則分別降低38%和28%。
上海AI實驗室青年科學家李弘揚介紹,憑借其充分的可解釋性、安全性、與多模塊的可持續迭代性,UniAD是目前最具希望實際部署的端到端模型。
基於UniAD的純視覺自動駕駛方案可為產業界提供全新研發思路,在節省大量硬件成本的同時,有助於提高出行的安全性與舒適性,該科研成果在產業界的落地應用將推動自動駕駛技術與產品的規模化發展。