2022年底ChatGPT橫空出世,其在理解人類意圖、思維鏈推理、零樣本下處理問題的能力優異。
2023年3月大模型GPT4發佈,性能進一步增強,並擁有多模態能力可實現『看圖說話』。
諸多科技巨頭紛紛推出自己構建的大模型,並且將多模態作為目標。
大模型如火如荼發展,帶來應用端的百花齊放,在傳媒、遊戲、電商、汽車等諸多行業大模型廣泛賦能,人工智能迎來『iPhone』時刻。
在大模型全面賦能背景下,自動駕駛也漸行漸近。
近期,開源證券中小盤團隊發佈專題報告《智能汽車系列深度《九》:ChatGPT橫空出世,大模型全面賦能,自動駕駛漸行漸近》,為您解讀大模型賦能自動駕駛各個環節及相關產業鏈玩家的投資機會。
大模型賦能自動駕駛,算法、數據閉環、仿真全面受益
目前自動駕駛算法歷經多年演變,呈現出幾大特點:
首先,基於神經網絡的算法逐步替代基於規則的算法,早年神經網絡主要用於感知環節,現在逐步在向規劃控制環節滲透。
其次,自動駕駛算法在早期以模塊化部署,每個模塊擁有獨立的優化目標,但整體模型的效果未必達到最優,因此端到端的自動駕駛解決方案映入人們眼簾,學界和產業界均進行了諸多探索。
最後,我們看到行業玩家逐步認可Transformer+BEV的算法構建模式,模型架構上逐步走向趨同,這無疑將推動包含芯片在內的整個產業鏈加速發展。
端到端自動駕駛算法逐步映入眼簾
資料來源:開源證券研究所
長尾問題處理是自動駕駛面臨的主要挑戰,數據驅動提供解藥。
當前,大部分算法可以覆蓋主要的行車場景,但駕駛環境紛繁復雜,仍有諸多罕見的長尾場景需要算法識別和處理,這類場景雖不常見但無法忽視,成為制約自動駕駛成熟的主要瓶頸。
行業通常采用大量的數據去訓練自動駕駛算法,以求讓自動駕駛模型成為見多識廣的『老司機』。
毫末智行認為自動駕駛能力與數據量直接相關
資料來源:毫末智行公眾號
自動駕駛在模型端仍需優化,數據閉環、仿真工具仍待完善。
自動駕駛近年發展迅猛,硬件預埋軟件持續迭代的風潮下,車載算力急劇增長快速普及,但軟件端功能進化滯後於算力。
軟件端算法、數據閉環、仿真系統均有待完善。
算法領域感知、預測、決策、規劃模型都在不斷升級演進,精度、可靠性均有提升空間。
數據閉環系統方面,伴隨有關車型量產,數據的挖掘、標註和處理工作量龐大,數據閉環系統自動化高效運行決定模型能否由數據驅動持續迭代。
仿真環節,理論上優質仿真可替代實車數據收集,降低算法搭建成本並提升迭代速率,但逼真的仿真環境的構建、諸多的長尾場景的復現難度大。
軟件升級速率滯後於硬件
資料來源:開源證券研究所
自動駕駛算法、數據閉環、仿真工具仍待完善
資料來源:開源證券研究所
2、大模型全面賦能,自動駕駛各大環節全面受益
大模型可在算法、數據閉環、仿真等環節全面賦能自動駕駛。
大模型具有良好的認知和推理性能,作為人工智能最先落地的應用領域之一,自動駕駛有望得到全面助力。
首先在數據閉環和仿真環節,大模型的精準識別和數據挖掘以及數據生成能力可對數據挖掘、數據標註、以及仿真場景構建賦能。
其次在模塊化的算法部署模式下,感知算法、規控算法亦可受到大模型的加強而實現感知精度和規控效果的提升。
最後,端到端的感知決策一體化算法被認為是自動駕駛算法終局,但面臨諸多難以解決的問題,比如構建適合該算法的仿真環境、端到端的數據標註等,而在大模型時代以上問題或不再成為瓶頸,落地指日可待。
大模型從多個維度全面推動自動駕駛前行
資料來源:開源證券研究所
《1》大模型助力數據挖掘和自動標註,數據飛輪飛馳推動自動駕駛落地
在自動駕駛的數據閉環體系構建過程中存在數據挖掘和自動標註等難點。
隨著量產車型數量增加,產生的數據量呈現指數級增長,一方面,高效的利用數據實現預期的訓練效果要求系統具有數據挖掘、處理能力。
另一方面,海量數據的標註帶來高昂的成本,而部分3D場景人工標註較為困難,進一步限制算法模型迭代和應用,大模型誕生後這兩類問題有望迎刃而解。
百度采用大模型實現長尾數據的挖掘
資料來源:Apollo智能駕駛公眾號
商湯推動標註2.0時代演進,自動標註成為主流
資料來源:商湯科技官方視頻號
毫末智行DriveGPT大幅降低標註成本
資料來源:毫末智行公眾號
《2》大模型推動算法迭代,感知規控全賦能
大模型作為車端算法的『老師』,通過『蒸餾《教授》』幫助小模型實現優異的性能。
大模型在自動駕駛感知端算法的應用:百度將文心大模型的能力與自動駕駛感知技術結合,提升車載端側模型的感知能力。
感知大模型依靠半監督的方式迭代
資料來源:Apollo智能駕駛公眾號
大模型在規控端應用:毫末智行發佈行業首個DriveGPT。
毫末智行推出DriveGPT,可實現城市輔助駕駛、場景脫困、駕駛策略可解釋等功能。
毫末智行DriveGPT大模型將助力自動駕駛落地
資料來源:毫末智行官方公眾號
《3》生成海量數據,大模型助力仿真平臺及端到端自動駕駛模型構建
大模型能夠生成海量可訓練數據,推動端到端自動駕駛模型落地。
雲驥智行認為自動駕駛的終局會演進成為一個超大規模的端到端自動駕駛神經網絡:AD-GPT。
而為了實現它,自動駕駛神經網絡、海量高價值數據、車端高算力平臺缺一不可。
這些在模塊化構建算法的時代難以實現,而當大模型誕生後,無論在車端一體化模型的構建、還是端到端訓練仿真數據的生成似乎都觸手可及。
究其本源,大模型本質上是對輸入信息作出反應,而自動駕駛則是這類行為中的一個子集。
自動駕駛端到端大模型構建需要海量資源
資料來源:雲驥智行官方公眾號
自動駕駛漸行漸近,行業玩家乘風起
1、科技巨頭構築自動駕駛行業『安卓』,技術鴻溝有望縮小
第三方玩家有望通過提供構建大模型的工具鏈,打造自動駕駛行業的『安卓系統』,技術鴻溝有望縮小。
特斯拉全棧自研的自動駕駛系統,包含算法、數據閉環系統《自動標註、仿真、數據引擎》等,閉環的體系構成自動駕駛行業的『IOS』,海量的車隊數據形成數據壁壘,其他玩家難以復制。
而大模型時代,諸多第三方科技巨頭如微軟、英偉達、百度、商湯等加入自動駕駛行列,可通過提供強大的大模型構建能力以及完善的工具鏈幫助整車廠構建自己的自動駕駛算法和數據閉環系統,同時依靠大模型的數據生成能力彌補與頭部玩家在數據領域的差距,從而構建自動駕駛領域的『安卓』,快速提升玩家自動駕駛能力。
特斯拉自動駕駛解決方案堪稱自動駕駛界『IOS』
資料來源:騰訊網、開源證券研究所
第三方巨頭憑工具鏈有望構築自駕領域『安卓』
資料來源:各公司官網、開源證券研究所
科技巨頭摩拳擦掌,微軟、英偉達爭相佈局,有望加速行業發展。
我們已經看到,巨頭如微軟、英偉達在自動駕駛領域以及大模型領域都進行了深度佈局,有望將二者結合幫助車企實現能力飛躍。
微軟:自動駕駛方面,微軟通過微軟雲可提供覆蓋全球的雲計算和邊緣計算能力,借助雲上的PaaS和SaaS軟件可賦能各類算法和應用開發。
大模型方面,微軟雲推出了Azure OpenAI服務,企業可獲得對大模型《含GPT、Codex、嵌入模型》的訪問權限並將其應用於新的場景如語言、代碼、邏輯、推理、理解等,同時也允許客戶微調生成定制化的模型。
而結合微軟的認知搜索,可以進一拓寬大模型的應用領域和提升應用效果。
微軟及OpenAI依托強有力的大模型能力,未來或許能在自動駕駛算法、仿真領域擦出新的火花。
微軟雲可提供OpenAI接口服務
資料來源:微軟雲官網
英偉達:自動駕駛方面,英偉達在自動駕駛領域佈局已久,擁有從算法到底層軟件中間件再到芯片的全棧解決方案。
大模型方面,英偉達進一步強化『賣鏟人』地位,幫助企業玩家構建自己的大模型產品。
在2023年GTC大會上,英偉達推出AI Foundations雲服務,用於幫助客戶構建生成式AI模型如大語言模型、生物學模型、AI生成式圖像模型等。
英偉達DriveSim可完美生成自動駕駛仿真場景
資料來源:英偉達官網
2、行業分工加速,成本下降可期
行業分工加速,自動駕駛算法體系成本或迎下降。
隨著大模型逐步介入自動駕駛,行業分工將進一步明確。
第三方科技巨頭的加持下,整車廠無需大規模搭建龐雜的算法、數據等整個閉環體系的團隊,即可擁有比肩全球一線水平的自動駕駛算法模型體系。
產業鏈分工合作,避免『重復造輪子』,自動駕駛的成本有望大幅降低,滲透率將加速提升。
同時,隨著更多自動駕駛車型上路,數據收集效率和效果也會進一步提升,反過來推動行業進步。
3、大模型開發者、自動駕駛產業鏈玩家全面受益
《1》百度Apollo:自動駕駛元老,文心大模型全面賦能。
百度在自動駕駛領域的探索一馬當先,大模型方面,在谷歌推出Bert後即開始投入研發,起步較早,因此對於大模型在自動駕駛領域的應用深有心得。
最新的Apollo Day及文心一言發佈會上,百度表示將在自動駕駛感知算法、圖文監督預訓練下的數據挖掘方案兩個方向推動大模型賦能自動駕駛,全面助力自動駕駛能力提升。
同時百度亦擁有Apollo開放平臺,對自動駕駛全流程開發體系擁有深厚積累,並與諸多開發者形成緊密的互動,未來有望深度受益本輪技術變革。
百度致力於利用文心大模型實現自動駕駛感知模型增強和長尾數據挖掘
資料來源:Apollo智能駕駛公眾號
《2》商湯科技:AI算法領軍,佈局大模型探索自動駕駛新機遇。
商湯利用大模型對小模型進行知識蒸餾,同時通過自動化標註實現感知和決策端的數據閉環。
此外大模型也可以生成困難圖片,解碼3D環境、路徑規劃、駕駛動機等使得駕駛行為可解釋。
作為傳統AI算法領域的領軍,公司在自動駕駛算法領域發力,目前產品已經落地多款車型。
未來有望持續受益大模型在自動駕駛的應用。
商湯將大模型用來賦能自動駕駛感知閉環和決策閉環等環節
資料來源:商湯科技官方視頻號
《3》地平線:智駕芯片新星,對算法的深入理解指引芯片架構迭代完美適配需求。
公司作為本土智能駕駛芯片領軍,對算法及大模型理解深入,有望指引公司芯片迭代以完美適應客戶需求。
地平線認為算法終將走向端到端的形式,因此公司也在構建下一代的面向Transformer的統一計算架構,而其下一代BPU納什架構將專為大參數Transformer模型設計。
地平線在CVPR中提出基於Transformer的端到端的自動駕駛算法框架,該文章首次在檢測、跟蹤、預測、建圖、軌跡預測、端到端完成自動駕駛的算法,這可以讓玩家用海量數據去訓練整個自動駕駛系統。
地平線認為未來需繼續用大數據和大模型無監督的預訓練模型讓其學習人類駕駛的常識。
語言模型是給定一個文本去預測下一個詞的概率,同樣給定當前交通環境/導航地圖/駕駛員整個駕駛行為歷史,模型亦可從大規模的無監督數據中學習,構建自回歸的大語言模型預測下一個駕駛動作。
地平線認為未來自動駕駛終將走向端到端算法
資料來源:中國汽車百人會公眾號
4、產業鏈玩家:自動駕駛落地加速,產業鏈各大環節全面受益
隨著自動駕駛的全面加速,整個自動駕駛產業鏈包含域控制器、算法、傳感器等環節亦將加速滲透。
產業鏈玩家如德賽西威、經緯恒潤、華陽集團、北京君正、晶晨股份、美格智能、均勝電子、華測導航、瀚川智能、炬光科技、源傑科技、長光華芯等均值得關注。
受益公司盈利預測與估值
數據來源:Wind、開源證券研究所《註:收盤日期2023年5月12日,盈利預測均來自開源證券研究所》
本文源自券商研報精選