全球最佳！提出感知決策一體化端到端自動駕駛大模型上海科研團隊閃耀AI頂會。

圖說：上海人工智能實驗室等聯合論文獲最佳論文獎采訪對象供圖《下同》

6月21日，全球人工智能和計算機視覺領域頂級國際會議CVPR2023正式公佈獎項。

上海人工智能實驗室、武漢大學及商湯科技聯合論文《以路徑規劃為導向的自動駕駛》《UniAD》榮獲最佳論文獎。

該論文提出了首個感知決策一體化的端到端自動駕駛大模型，開創了以最終規劃任務為全局優化目標的自動駕駛技術新方向。

這是近十年中國學術機構作為第一單位首次獲CVPR最佳論文獎，也是近十年計算機視覺三大頂級會議《CVPR、ICCV、ECCV》的最佳論文獎首次頒給第一單位為中國的學術機構。

CVPR是計算機視覺和人工智能領域公認的頂級會議。

CVPR最佳論文是計算機視覺領域學術研究的頂級榮譽，對技術和行業發展將產生重要影響。

根據谷歌學術統計，CVPR在所有學術期刊和會議中位列《自然》《Nature》、《新英格蘭醫學雜志》《The New England Journal of Medicine》和《科學》《Science》之後排名第四。

2023年CVPR會議在加拿大溫哥華舉行，今年CVPR會議共計9155篇投稿，2359篇論文被接收《接收率25.78%》。

在本屆CVPR上，上海人工智能實驗室以一篇最佳論文、一篇最佳論文候選、12篇入選『《高亮》Highlight』名單的成績，在國際學術舞臺上展現了中國AI實力。

自動駕駛是一個高度復雜的技術體系，不僅需要多個學科領域的知識和技能，包括傳感器硬件、機器學習、多模態融合等內容，還需要適應不同國家與地區的道路規則和交通文化，與車輛及行人進行良好的交互，以實現高度的可靠性和安全性。

自動駕駛系統包含三大主任務：感知、預測和規劃。

當前，業界主流的方案架構分別采用不同的模塊來處理這些具體任務，但由於各模塊並非以駕駛為最終目標進行優化，因而自動駕駛系統的整體性能提升受到了很大限制。

圖說：UniAD：業界首個感知決策一體化的自動駕駛大模型

在UniAD中，研究人員首次將感知、預測和規劃等三大類主任務、六小類子任務《目標檢測、目標跟蹤、場景建圖、軌跡預測、柵格預測和路徑規劃》整合到統一的基於Transformer的端到端網絡框架下，實現了全棧關鍵任務駕駛通用模型。

在nuScenes真實場景數據集下，UniAD的所有任務均達到『領域最佳性能』，尤其是預測和規劃效果遠超之前的最佳方案。

其中，多目標跟蹤準確率超越『領域最佳性能』20%，車道線預測準確率提升30%，預測運動位移和規劃的誤差則分別降低了38%和28%。

圖說：在晴天直行場景中，UniAD 可以感知左前方等待的黑色車輛，預測其未來軌跡《即將左轉駛入自車的車道》，並立即減速以進行避讓，待黑車駛離後再恢復正常速度直行

圖說：在夜晚視野變暗的情況下，UniAD能感知到前車並完成先靜止，後左轉的規劃

上海AI實驗室青年科學家李弘揚介紹，憑借其充分的可解釋性、安全性、與多模塊的可持續迭代性，UniAD是目前為止最具希望實際部署的端到端模型。

基於UniAD的純視覺自動駕駛方案可為產業界提供全新的研發思路，在節省大量硬件成本的同時，有助於提高出行的安全性與舒適性。

該科研成果在產業界的落地應用，將有力地推動自動駕駛技術與產品的規模化發展。

自動駕駛是通用智能大模型『書生』重要的落地應用領域之一，近年來，上海AI實驗室自動駕駛團隊不斷突破創新，挑戰各項自動駕駛研究任務，在多模態、時空融合、端到端、多任務等方面提出了新思路、新模式。

『以原始創新引領技術突破，上海AI實驗室作為人工智能領域的新型科研機構，致力於通過開展戰略性、原創性、前瞻性的科學研究與技術攻關，目標成為享譽全球的人工智能原創理論和技術的策源地』上海AI實驗室主任助理喬宇表示。

新民晚報記者郜陽

全球最佳！提出感知決策一體化端到端自動駕駛大模型 上海科研團隊閃耀AI頂會。