小鵬汽車已經不再用“1024 Day”來稱呼自己的技術發布日,但依然在10月24日這天做了一場關于AI技術的發布會,主要是對小鵬P7+的智駕和智能座艙的AI技術做了分享。
活動內容并不復雜,就是介紹了一下小鵬P7+上面即將推出的一些新技術、新功能,用了現在流行的AI、端到端這些詞匯,聽上去好像各家都差不多。但是里面有一些小鵬汽車對智駕路線的思考還是值得記錄一下,也能看到小鵬是如何看待自己的技術迭代。
首先我們知道,在5月份的時候,小鵬汽車就說自己發布國內首個量產上車的端到端大模型,成為全球唯二量產端到端大模型的車企。但是真正落地,各家車企都是爭先恐后,比如華為ADS 3.0說自己感知模塊用了端到端,而理想汽車也說自己用了One Model的端到端,甚至趕在了小鵬這次發布會的前一天做了“全量推送”。

但是小鵬汽車副總裁、自動駕駛負責人李力耘博士分析了目前行業主流的三種端到端發展路線,認為各個路線優缺點明顯:一種是通過大量規則小模型堆疊的 “大模型”,其需要大量的優秀規則工程師;一種是“車端大模型”,即直接將端到端模型部署于車輛上,雖然見效快,但受限于車端算力,且隨著后期訓練數據量的增加,容易陷入瓶頸;最后一種便是云端大模型(foundation model),其參數量是車端模型的幾十倍甚至數百倍,這是單純的車端大模型所不可企及的。
按照我的理解,第一種大概就是說分段式端到端路線,技術實現上比較簡單,也可以說是端到端;第二種路線則是理想汽車的雙系統中的“系統2”,也就是視覺大模型,一個22億模型參數量的端側大模型。第三種則是使用了云端大模型的路線,也就是小鵬和華為的路線。

從李力耘的角度來看:“盡管選擇前兩種端到端的技術路線都能帶來一定成效,但從智駕競爭的終局來看,布局云端大模型才是制勝關鍵。而小鵬汽車早在預研端到端大模型的階段,就篤定要先構建一個強大的‘云端大模型’,這也與全球頭部AI企業——OpenAI所選擇的路線不謀而合。”
怎么樣理解云端大模型的應用呢?根據小鵬給出的示意圖,基本可以理解為云端大模型做出來以后會“知識蒸餾”成車端的端到端模型,再上車應用。這樣的優勢在于因為云端大模型足夠大,信息量足夠豐富——小鵬云端大模型的參數量將多達車端參數量80倍,如此大的參數量意味著云端大模型能夠全面吸納智駕數據,不遺漏重點信息細節——這樣“蒸餾”出來的車端大模型上限也就更高。之后車輛的駕駛數據、離線強化學習也可以反饋給云端模型,不斷優化。
因此,小鵬表示智駕還是需要更大的訓練規模。目前,小鵬云端大模型的訓練效率已提升了2.6倍,2025年小鵬云端的算力將會達到10EFlops以上。

當然,從小鵬汽車選擇的純視覺路線來看,輕雷達、輕地圖的智駕方案本身也要求高算力大模型。比如相較于傳統的激光雷達方案,小鵬AI鷹眼視覺方案的攝像頭信息量是前者的80倍,而攝像頭能夠感知的語義和顏色信息是其100倍,攝像頭的反應速度也是其3倍。這本身就要求更大算力、也要求大模型在處理方式上的不同。
按照小鵬汽車的說法,小鵬P7+的AI鷹眼視覺方案在體驗上已經可以和搭載激光雷達的現款車型的Max版本保持一致、同步更新。這或許也意味著,今后小鵬汽車是完全能夠以同一套純視覺方案來替代所有之前的智駕方案,只要都是2顆Orin X的芯片,理論上都能夠實現接近的體驗——之前有激光雷達的車型相當于不用激光雷達的數據了。
