21世紀經濟報道記者張梓桐上海報道
日前,首個自動駕駛領域大模型迎來面世,毫末智行發佈自動駕駛生成式大模型『雪湖·海若』,通過引入駕駛數據建立RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續優化,最終實現端到端自動駕駛。
21世紀經濟報道記者了解到,『雪湖·海若』現階段主要用於解決自動駕駛的認知決策問題。
目前,『雪湖·海若』實現了模型架構與參數規模的升級,參數規模達到1200億,預訓練階段引入4000萬公裡量產車駕駛數據。
在毫末智行董事長張凱看來,隨著AI大模型推動下的產業生態正在不斷進化和升級。
城市導航輔助駕駛產品在2023年將圍繞量產交付發力,幾個主要玩家的城市導航輔助駕駛產品將會進入到真實用戶交付和多城市並行落地的比拼中。
此外,表示行泊一體和無人車的商業化將成為自動駕駛公司深耕的重點。
NOA密集發佈
隨著近日百度、華為等大廠紛紛發佈NOA產品,自動駕駛正在逐漸滲透至城市復雜道路中。
張凱判斷稱,在乘用車領域,隨著搭載規模的增長和智駕產品整體成本的下降,智駕產品也將從高端車型向更多中低端車型全面覆蓋。
搭載低成本行泊一體功能的智駕產品將迎來一個前裝量產的高潮,高速導航輔助駕駛、自主泊車等產品的體驗也會迎來全面升級,車主的使用頻率和滿意度將成為產品競爭力的主要衡量標準。
而在末端物流自動配送領域,末端物流自動配送在商超、快遞等場景將會迎來爆發,2023年將在這些場景實現可持續的商業化閉環。
張凱認為,AI大模型推動下的產業生態的不斷進化和升級具體體現在三個方面,首先在數據生態上,隨著用戶更高頻地開啟輔助駕駛功能,智駕行駛的行駛裡程和使用頻率呈現指數級提升,足夠規模和多樣化的數據帶來數據積累的優勢,可以更好驅動自動駕駛技術的快速迭代升級。
其次在AI技術生態上,生成式大模型已成為自動駕駛系統進化的關鍵,基於Transformer大模型訓練的感知、認知算法,將逐步在車端進行落地部署。
在算力生態上,基於自動駕駛數據的大規模增長,以及大模型的深入應用,智算中心已經成為自動駕駛行業的『新基建』。
容錯率極低
在毫末智行之外,越來越多的自動駕駛公司開始將目光放在大模型領域內。
在日前的中國電動汽車百人會論壇《2023》上,地平線CEO餘凱發表演講稱,近期ChatGPT的火熱給自動駕駛行業帶來了很大啟發,二者之間也存在許多相似之處。
『自動駕駛行業應該繼續用更大的數據、更大的模型,並且無監督地去學習人類駕駛的嘗試』
但與此同時,兩者之間仍存在較為明顯的不同,餘凱表示,ChatGPT的工作容錯率相對比較高,而自動駕駛特別是無人駕駛,容錯率為零。
此外,ChatGPT的計算在雲端,在雲端有充分的能量供給、電源供給,同時有非常好的系統。
但是自動駕駛大模型計算在車上依賴的是電池和車端散熱,而這一挑戰很大,意味著自動駕駛不能用那麼大的模型和計算。
除此之外,餘凱表示,類似於ChatGPT從大量無監督且沒有標註的自然文本裡去學習,每個駕駛員駕駛控制的序列就可以被當做一個個自然語言文本。
而語言模型的運行邏輯在於給定一個文本的歷史預測下一個詞的概率。
『在自動駕駛行業內如果給定當前的交通環境以及導航地圖,駕駛員駕駛行為的歷史,就可以預測其下一個駕駛動作。
從大量無監督不需要標註的行為裡面去獲得學習,構建一個回歸自動駕駛的大語言模型。
餘凱坦言稱,這個事情本質在於參數越多系統越聰明,ChatGPT—3大概擁有1750億參數,ChatGPT—4差不多有1萬億參數,人類大腦是100萬億參數。
參數的規模決定了智能的水平,沒有神秘的魔法,人類這麼聰明無非就是我們的大腦容量確實大』豫開說道。