全球最佳!提出感知決策一體化端到端自動駕駛大模型 上海科研團隊閃耀AI頂會。

全球最佳!提出感知決策一體化端到端自動駕駛大模型 上海科研團隊閃耀AI頂會。

圖說:上海人工智能實驗室等聯合論文獲最佳論文獎采訪對象供圖《下同》

6月21日,全球人工智能和計算機視覺領域頂級國際會議CVPR2023正式公佈獎項。

上海人工智能實驗室、武漢大學及商湯科技聯合論文《以路徑規劃為導向的自動駕駛》《UniAD》榮獲最佳論文獎。

該論文提出了首個感知決策一體化的端到端自動駕駛大模型,開創了以最終規劃任務為全局優化目標的自動駕駛技術新方向。

這是近十年中國學術機構作為第一單位首次獲CVPR最佳論文獎,也是近十年計算機視覺三大頂級會議《CVPR、ICCV、ECCV》的最佳論文獎首次頒給第一單位為中國的學術機構。

CVPR是計算機視覺和人工智能領域公認的頂級會議。

CVPR最佳論文是計算機視覺領域學術研究的頂級榮譽,對技術和行業發展將產生重要影響。

根據谷歌學術統計,CVPR在所有學術期刊和會議中位列《自然》《Nature》、《新英格蘭醫學雜志》《The New England Journal of Medicine》和《科學》《Science》之後排名第四。

2023年CVPR會議在加拿大溫哥華舉行,今年CVPR會議共計9155篇投稿,2359篇論文被接收《接收率25.78%》。

在本屆CVPR上,上海人工智能實驗室以一篇最佳論文、一篇最佳論文候選、12篇入選『《高亮》Highlight』名單的成績,在國際學術舞臺上展現了中國AI實力。

自動駕駛是一個高度復雜的技術體系,不僅需要多個學科領域的知識和技能,包括傳感器硬件、機器學習、多模態融合等內容,還需要適應不同國家與地區的道路規則和交通文化,與車輛及行人進行良好的交互,以實現高度的可靠性和安全性。

自動駕駛系統包含三大主任務:感知、預測和規劃。

當前,業界主流的方案架構分別采用不同的模塊來處理這些具體任務,但由於各模塊並非以駕駛為最終目標進行優化,因而自動駕駛系統的整體性能提升受到了很大限制。

圖說:UniAD:業界首個感知決策一體化的自動駕駛大模型

在UniAD中,研究人員首次將感知、預測和規劃等三大類主任務、六小類子任務《目標檢測、目標跟蹤、場景建圖、軌跡預測、柵格預測和路徑規劃》整合到統一的基於Transformer的端到端網絡框架下,實現了全棧關鍵任務駕駛通用模型。

在nuScenes真實場景數據集下,UniAD的所有任務均達到『領域最佳性能』,尤其是預測和規劃效果遠超之前的最佳方案。

其中,多目標跟蹤準確率超越『領域最佳性能』20%,車道線預測準確率提升30%,預測運動位移和規劃的誤差則分別降低了38%和28%。

圖說:在晴天直行場景中,UniAD 可以感知左前方等待的黑色車輛,預測其未來軌跡《即將左轉駛入自車的車道》,並立即減速以進行避讓,待黑車駛離後再恢復正常速度直行

圖說:在夜晚視野變暗的情況下,UniAD能感知到前車並完成先靜止,後左轉的規劃

上海AI實驗室青年科學家李弘揚介紹,憑借其充分的可解釋性、安全性、與多模塊的可持續迭代性,UniAD是目前為止最具希望實際部署的端到端模型。

基於UniAD的純視覺自動駕駛方案可為產業界提供全新的研發思路,在節省大量硬件成本的同時,有助於提高出行的安全性與舒適性。

該科研成果在產業界的落地應用,將有力地推動自動駕駛技術與產品的規模化發展。

自動駕駛是通用智能大模型『書生』重要的落地應用領域之一,近年來,上海AI實驗室自動駕駛團隊不斷突破創新,挑戰各項自動駕駛研究任務,在多模態、時空融合、端到端、多任務等方面提出了新思路、新模式。

『以原始創新引領技術突破,上海AI實驗室作為人工智能領域的新型科研機構,致力於通過開展戰略性、原創性、前瞻性的科學研究與技術攻關,目標成為享譽全球的人工智能原創理論和技術的策源地』上海AI實驗室主任助理喬宇表示。

新民晚報記者 郜陽