①這場由ChatGPT引起的『AI狂歡』中,技術大跨步邁進的,並不隻有能在線上與用戶自由交流的聊天機器人,更有線下能與現實世界切實交互的實體機器人們; ②特斯拉『擎天柱』站上了機器人、AI、自動駕駛的交匯點; ③機器人降本或分為三步,而『擎天柱』還有84%降價空間。
《科創板日報》6月17日訊《編輯 鄭遠方》說起AI技術,自動駕駛與大模型是兩大重要議題。
而在『AI熱潮』催化之下,作為AI關鍵載體之一的機器人將這兩條主線匯聚至一處,指向了AI下一個浪潮『具身智能』,即能理解、推理、並與物理世界互動的智能系統。
特斯拉不久前披露Optimus人形機器人最新進展,機器人展現出不帶輔助的行走能力,且能精準做到電機轉矩控制,產品力的進步也被看作產業化漸近的信號。
值得注意的是,Optimus內置FSD芯片、與汽車共用AI系統,畢竟正如馬斯克所說,『我們的汽車差不多算是有輪子的半感知機器人』
與此同時,相繼面世的大模型則進一步賦予了機器人更智慧的『大腦』與『感官』。
例如Meta的SAM《Segment Anything Model》模型可分割圖像中的一切對象,向多模態更進一步的同時,一舉突破了機器視覺底層技術;還有谷歌聯合柏林工業大學團隊發佈的『史上最大‘通才’AI模型』PaLM-E,隻需要一句簡單指令,便可實現更為自主的機器人控制,使得機器人的行動不再需要仰賴人類的手寫指令與代碼。
可以看到,這場由ChatGPT引起的『AI狂歡』中,技術大跨步邁進的,並不隻有能在線上與用戶自由交流的聊天機器人,更有線下能與現實世界切實交互的實體機器人們——此番熱潮賦予了後者更聰明的大腦、更敏銳的眼睛以及更具行動能力的軀體。
▌特斯拉『擎天柱』:站在機器人、AI、自動駕駛的交匯點
在人形機器人行業中,特斯拉的Optimus《擎天柱》可以說得上是行業『領頭羊』。
特斯拉研發人形機器人的初衷,便是最大程度上利用特斯拉在造車和自動駕駛方面的優勢,特別是自動駕駛研發過程中積累的算法經驗、數據驅動能力、AI芯片能力、模型訓練能力等。
開源證券指出,智能是特斯拉投入機器人領域最核心的競爭力。
人形機器人與特斯拉自動駕駛汽車都遵循『感知-認知-決策-執行』運行邏輯。
而正如上文提到的,特斯拉機器人與汽車共用FSD系統。
該系統由數據、算法、硬件構成整體架構,其迭代路徑則是通過不斷升級算力的硬件來支撐不斷升級的算法,從而處理不斷增加的海量數據。
其中,分析師指出,數據方面,特斯拉FSD系統已有海量數據儲備,開發人形機器人可節省大量前期費用。
感知方面,特斯拉FSD系統擁有非常強大的純視覺感知方案,特斯拉已引入Occupancy Network,與激光雷達相比,其視覺的語義感知能力更強。
對於成本控制更加嚴格的人形機器人而言,類似Occupancy Network的方式優於激光雷達解決方案。
規劃和控制方面,特斯拉『交互搜索』規劃模型進一步增強了FSD系統的規控能力,且FSD系統還能通過Occupancy Network對可視區域進行建模,以處理未知不可見場景。
圖|特斯拉Optimus復用Occupancy Network感知網絡
▌人工智能與機器人相輔相成
大模型可通過將圖像、文字、具身數據聯合訓練,引入多模態輸入,進而提升大模型和環境的交互能力和學習能力,推動機器人向更智能、靈活和自主的方向發展。
人工智能是機器人實現智能化的關鍵,而與此同時,對於人工智能技術而言,機器人則是重要落地場景。
如廣發證券指出的,人形機器人作為具象的實體,是AI絕佳載體。
一方面,機器人、特別是人形機器人能豐富AI的表現方式。
除了傳統的語音交互、圖片交互,人形機器人也為AI帶來了更多的交互方式,包括表情、手勢等,極大延展了AI的表達領域。
另一方面,機器人也承擔起了AI輸出窗口的作用。
以英國機器人公司Engineered Arts研發的一款類人型機器人Ameca為例,除了與人類相像的外表,其最重要的功能便是為各種AI技術提供了一個真實的平臺。
用戶可以根據需要,從庫中快速加載預先保存的姿勢、聲音、動畫和子序列,隻需使用計算機鼠標或觸摸板,單擊並拖動機器人的功能,就能實現豐富的面部表情。
▌機器人降本『三步走』 哪些環節扮演關鍵角色?
邁過實驗室技術積累階段,機器人行業正逐漸邁向具身智能時代。
產業鏈各環節的技術進步推動者機器人產業不斷向前,而整體行業的擴張也為產業鏈打開了更廣闊的的空間。
機器人關鍵技術可分為AI技術與傳動技術,其中廣發證券指出,運動模塊硬件等非核心傳動部件並非是機器人公司專長,外購概率較高。
圖|機器人關鍵技術分類《來源:廣發證券》
機器人龍頭之一的波士頓公司因缺乏合適供應商而『被迫』自研伺服閥,公司曾公開表示,作為機器人公司並不想自研伺服閥,公開尋求供應商。
因此分析師也猜測稱,攝像頭和算法等核心部件,特斯拉將進行汽車供應商平移或自制供應;而對於減速器、伺服等技術要求較低的驅動部件,或尋求外部供應。
而開源證券補充稱,特斯拉機器人關節執行器采用的零部件種類和現有工業機器人基本一致,隻需根據人形機器人特點對零部件進行調整修改,就可進行標準化量產,且軸承、齒輪箱、滾珠絲杠、電機等部件可復用特斯拉汽車供應鏈。
再次以特斯拉Optimus為例,這一機器人具體有哪些零部件?券商列出了具體零部件名單與相關標的。
《1》旋轉關節:無框力矩電機、諧波減速器和力矩傳感器是價值量占比最高的零部件,降價空間最大的為無框電機《降價75%》、諧波減速器《降價75%》、角接觸軸承《降價64%》。
《2》線性關節:是特斯拉機器人在硬件端優化升級的核心。
行星滾柱絲杠、倒置滾柱絲桿價值量占比,行星滾柱絲杠在特斯拉機器人硬件總成本中占比也最高。
兩者相比早期階段,降價空間分別達到93%、95%。
《3》靈巧手:內部構成是一個微型線性執行器《伺服電缸》。
國產廠商在除了減速箱以外的其他零部件領域均處於量產的佈局期,能夠率先實現微型線性執行器量產的企業將通過規模效應大幅降本。
《4》加工設備:磨床和齒輪加工機床是減速器、軸承、滾珠絲杠、電機在精加工階段的重要設備。
國內秦川機床、寧江機床、北平機床已具備批量生產高精度齒輪加工設備的能力。
《5》其他零部件:特斯拉人形機器人電池實現小體積大容量,推測復用汽車動力電池技術。
視覺傳感器硬件為左右單目相機+魚眼相機,硬件成本較低,依賴算法。
集成汽車視覺傳感技術,工廠等部分場景有應用GPS傳感器。
數據顯示,目前Optimus硬件成本占BOM表比例超過50%,要達到2萬美元售價還有84%的降價空間。
對比當前時點和終局狀態下BOM表拆解,開源證券指出,線性關節和靈巧手的降本空間最大。
總體而言,目前人形機器人成本約為 10-15 萬美元左右。
優必選預測,根據量產規模不同,人形機器人降本進程大致分為3個階段:
幾千臺小批量生產,降本20%-30%至約10萬美元;
1萬-幾萬臺量產,降本50%至5萬美元;
幾十萬至上百萬臺大規模量產,降本70%-80%至2-3萬美元。
▌結語
總體而言,AI大模型與人形機器人的相輔相成,邁出了通向通用人工智能的一大步。
國泰君安指出,服務機器人商業化落地的前提是產品能提供真實價值,而真實價值的判斷在於機器人能否通用。
將機器人做成人形,便是為了使機器人的執行能力更加通用。
伴隨著自動駕駛技術的高速發展,人形機器人在視覺、SLAM與基礎AI上有了更多方案選擇。
分析師預計,大模型的出現,會從語音、視覺、決策、控制等多方面實現同人形機器人的結合,形成感知、決策、控制閉環,機器人產業有望進入滲透率快速提升的新階段。