賈浩楠 發自 凹非寺
量子位 | 公眾號 QbitAI
內蒙古中部城市烏蘭察佈,西承陰山東段,南接內蒙古高原。
天然具有涼爽的氣候、充足的風電等等資源,隸屬於國家『東數西算』內蒙古樞紐節點。
2022年的今日今時,國內十餘家叫得上名號的一線車企、自動駕駛公司齊聚於此。
它們來這裡隻辦三件事:
算力、算力、還是算力!
而把自動駕駛行業渴求的算力帶給它們的,是阿裡雲。
烏蘭察佈,正在發生什麼?
第一個在烏蘭察佈解鎖超大算力的,是小鵬汽車。
其實也是阿裡雲和小鵬汽車一起為智能汽車行業的未來計算需求和發展趨勢打了個樣。
阿裡雲和小鵬合作打造的智算中心,既是全國最大的,也是國內第一個投入實際運營的,專為自動駕駛服務的超大智能算力集群。
所謂『智算中心』,並不是傳統意義上的超級計算機。
自動駕駛、或者說智能汽車上的核心功能,其實都是AI。
具體說,是大規模的深度學習算法。
而無論是訓練,還是測試這樣的模型,扮演主角的不再是傳統CPU的邏輯推理能力,而是以AI加速器為主的浮點計算能力,GPU則是當前AI加速器的主流。
所以,智算中心的第一個特征,就是以大規模GPU算力作為AI模型迭代的基礎。
第二個特征,是與汽車業務深度結合,為智算中心提供了針對自動駕駛應用特征的算力集群、性能加速工具和AI大數據平臺,使得模型訓練性能、GPU資源利用率和算法研發效能都大大提升。
小鵬汽車和阿裡雲打造的智算中心,名叫『扶搖』。
『扶搖』之意,當然是阿裡雲提供的超大算力和針對性工具,能讓小鵬汽車的自動駕駛系統能力『直上九天』。
那麼,實際果真如此嗎?
已經建成交付的扶搖智算中心,總算力達到600PFLOPS。
這是個啥概念?
每秒進行6*1017次浮點運算,即60億億次。
整體計算效率上,扶搖實現了算力的線性擴展。
存儲吞吐比業界20GB/s的普遍水準提升了40倍,數據傳輸能力相當於從送快遞的微型面包車,換成了20多米長的40噸集裝箱重卡。
小鵬汽車一個典型核心自動駕駛模型,以前完整訓練一遍需要7天,而如今在扶搖上,隻需要一個小時。
自動駕駛模型訓練提速近170倍,會大力推動自動駕駛技術的發展速度,讓小鵬汽車的智能化程度和安全性都邁入新的階段。
迭代速度對於以智能化、自動駕駛立身的企業來說意味著什麼,無需贅述。
大算力給自動駕駛帶來的意義,何小鵬除了眼前的,也站在行業未來發展的角度給出另一番解讀:
未來5年,小鵬汽車可能還有百倍的算力需求增長。
希望大家都看到這個趨勢。
如果現在不以這樣的方式提前儲備算力,那麼今後5年內,企業算力成本會從億級,加到數十億級。
何小鵬為什麼這麼說——
自動駕駛,沒它不行嗎?
對於真正把智能化作為核心競爭力和未來發展方向的企業來說,沒智算中心,未來的競爭中就沒有底層根基。
行業有共識的普遍規律是:自動駕駛每提升一個等級,所需車端的算力會以一個數量級的速度增長。
比如一家公司研發的L2級輔助駕駛需要20TOPS的話,那L3則需要200TOPS,L4需要2000TOPS….
背後是核心AI模型的參數、規模以同樣大規模速度增長。
而企業後臺開發端的算力需求,業內人士估算:
車端算力增長一個數量級,相應的模型在後端訓練、驗證,並形成常態化的迭代,所需要的算力會以兩個數量級倍增。
所以智算中心對自動駕駛來說,最直接的意義在於提供更高的算力,訓練更大規模模型。
相應的,自動駕駛能力上限也就越高,直接決定未來行業競爭力高低。
但是,算力這個東西,可以通過自行購買GPU搭建集群的方式獲取,事實上,之前幾年行業內也是一直這麼幹的。
為什麼到了2022年,大家不約而同開始渴望智算中心了呢?
核心原因,在於今年頭部自動駕駛玩家的競速,已經到了搶先落地城市領航輔助駕駛的階段。
復雜路況下的復雜決策能力,包括識別紅綠燈、路口、行車車輛等等,其實已經進入L3-L4級范圍。
按照這樣的迭代速度,未來3-5年,自動駕駛研發很快會進入較為成熟的L4級甚至是L5級,迭代所需算力也會快速上升到『智算中心』級別。
如果自建數據中心的話,時間是最大的敵人。
需求算力的指數級膨脹,造成目前自動駕駛玩家的『算力』焦慮越來越嚴重。
當下自動駕駛對於智算中心的需求,其實是為未來的競爭力做儲備。
那麼,實現智算中心,現在行業裡有哪些方式?
成熟的例子,是特斯拉。
去年特斯拉宣佈自建智算中心Dojo,算力規模達1.8EPFLOPS,引起業內廣泛關注。
Dojo項目細節和進展透露不多,但外界肉眼可見的是,特斯拉將超大規模模型快速迭代,以及數據閉環能力修煉的爐火純青,背後肯定少不了超大算力的支持。
這也從實際效果上證明了類似智算中心這樣的能力,對自動駕駛的必要性。
小鵬與阿裡雲合作共建智算中心,又是一次重要證明。
『阿裡雲+』模式,如何評價?
可以說,這是一種更加貼合國內自動駕駛行業現狀的模式。
為什麼?
阿裡雲資深專家曹政給出了詳細的解答:
自建算力中心,且不說數十億的前期投入是不是創業公司能輕松承擔的,未來隨著GPU的迭代、超算架構的升級、自身需求的調整…每一次變更,幾乎都是從零開始的重新投入,伴隨著巨大的時間和資金成本。
建設算力中心,涉及的冗餘、升級、規劃等等都需要豐富的經驗。
但這些經驗,卻不是現在自動駕駛公司的核心KPI,它們的任務應該是快速提高自動駕駛的能力。
業界有種把智算中心建設等同於堆砌硬件的錯誤認知,忽略了智算中心的上層軟件和平臺。
而恰恰上層軟件平臺,是高效釋放算力並加工為生產力的核心,也是雲廠商數年巨大研發投入的沉淀,可以幫助自動駕駛公司站在雲廠商的肩膀上,快速聚焦自動駕駛算法的研發。
何小鵬『現在不做就晚了』的憂慮,看似是成本,其實是時間。
所以第二個問題,為什麼是阿裡雲?
自動駕駛需要的算力,阿裡雲能給,其他雲也能給。
但阿裡雲不可替代之處在於10年的技術積累,既有雲的,也有AI的。
表現之一在成本。
智算中心的方案規劃、性能參數、功能模塊、未來擴展性等等,阿裡雲都有著豐富的經驗,既保證交付時的先進性,又兼顧未來的拓展靈活性。
節省大量企業試錯的金錢和時間成本。
表現之二,在於阿裡雲給小鵬這樣的智能車相關企業提供的不隻是通用的雲服務,而是為AI相關業務量身訂制的算力產品。
比如在扶搖智算中心項目中,阿裡雲提供的,除了600PFLOPS算力,還有超大規模高性能網絡RDMA。
因為阿裡雲在以往電商任務經驗中已經認識到,AI是一個帶寬敏感業務,需要幾百G甚至上T的一個帶寬才能滿足計算需求。
而以CPU為主的通用超算,由於單數據流的處理模式,對帶寬要求並不高。
RDMA高性能網絡,單鏈路可以把帶寬提升到實現100G或200G的帶寬。
另外在單個服務器上並行擴展多張網卡,最高可到1.6PB帶寬。
表現之三,阿裡雲認為,他們的產品與自動駕駛、汽車工業深度契合。
自動駕駛耦合了HPC《高性能計算》、AI、大數據一體化等等需求,不僅僅是需要AI的算力,還需要大數據的算力、HPC的算力。
這種復合性的算力需求,加上大數據、AI和HPC一體的數據業務管理的流程平臺,才能達到自動駕駛企業要求。
而阿裡給小鵬汽車訂制的,就是這樣一套完整的智能汽車智算中心方案。
所以,對於中國智能汽車、自動駕駛行業來說,『阿裡雲+』的合作智算中心模式,首先是一劑巨大的助力,大大節約成本的同時,又大大提升了迭代進步的速度。
從行業競速角度講,則終結了企業獨自建超算的單打獨鬥,節約資源使其聚焦核心業務。
而最大的意義,可能是讓已經被特斯拉證明的自動駕駛黃金之路,在國內可以低成本實現。
這一點,沒有人比第一個吃螃蟹的何小鵬說得更明白:
智算中心讓小鵬擁有體系化能力、競爭力。
2025年,充分利用雲端算力的中國頭部玩家,有希望率先把『輔助自動駕駛』的『輔助』二字去掉。
— 完 —