特斯拉FSD的發(fā)展歷程——化繁為簡(jiǎn)
FSD是特斯拉輔助駕駛方案中功能最完整的產(chǎn)品
特斯拉的自動(dòng)駕駛方案包括基礎(chǔ)版自動(dòng)輔助駕駛(AP)、增強(qiáng)版自動(dòng)輔助駕駛(EAP)、以及完全自動(dòng)駕駛(FSD);其中,F(xiàn)SD全稱 Full Self-Driving(完全自動(dòng)駕駛),是特斯拉輔助駕駛Autopilot產(chǎn)品組合中功能最完整的產(chǎn)品。
功能上來(lái)看,特斯拉FSD除基礎(chǔ)的主動(dòng)巡航及車(chē)道維持居中外,還可以實(shí)現(xiàn):1)自動(dòng)輔助導(dǎo)航駕駛,包括自動(dòng)駛?cè)牒婉偝龈咚俟吩训阑蛄⒔粯虿砺房冢^(guò)行駛緩慢的車(chē)輛;2)自動(dòng)輔助變道,包括高速公路上自動(dòng)輔助變換車(chē)道;3)自動(dòng)泊車(chē),包括平行泊車(chē)與垂直泊車(chē);4)智能召喚則是在合適的場(chǎng)景下,停在車(chē)位的車(chē)輛會(huì)響應(yīng)召喚、駛出車(chē)位并前往車(chē)主所在位置;5)交通燈、標(biāo)志識(shí)別;6)市區(qū)自動(dòng)輔助轉(zhuǎn)向,檢測(cè)車(chē)道、車(chē)輛和障礙物,并操作車(chē)輛進(jìn)行轉(zhuǎn)向;7)自動(dòng)速度偏移調(diào)整,可根據(jù)不同的環(huán)境和場(chǎng)景,自主調(diào)整車(chē)輛的行駛速度。
特斯拉作為純視覺(jué)方案引領(lǐng)者,攝像頭是FSD智駕的核心
不同于大部分國(guó)內(nèi)廠商多傳感器融合方案,特斯拉FSD自動(dòng)駕駛是以攝像頭為核心的純視覺(jué)解決方案。純視覺(jué)方案的最初設(shè)計(jì)靈感來(lái)自對(duì)人類視覺(jué)的研究;即人眼睛搜集的信息到達(dá)視網(wǎng)膜后,經(jīng)過(guò)大腦皮層的多個(gè)區(qū)域、神經(jīng)層,最終形成生物視覺(jué),并在腦中生成圖像。特斯拉的目標(biāo)就是通過(guò)算法、軟件及硬件來(lái)設(shè)計(jì)汽車(chē)的視覺(jué)皮層,建立像人腦一樣的、基于視覺(jué)的計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)系統(tǒng)。 首先,在特斯拉汽車(chē)行駛過(guò)程中,車(chē)輛通過(guò)攝像頭收集環(huán)境圖像信息;特斯拉HW2.0/2.5/3.0版本硬件都配備了8顆監(jiān)測(cè)不同方位的攝像頭,分別為三顆前置攝像頭(其中1顆主攝像頭、1顆廣角攝像頭、1顆窄視長(zhǎng)焦攝像頭)、2顆前側(cè)攝像頭、2顆后側(cè)攝像頭、以及1顆后置攝像頭。
算法端迭代
自動(dòng)駕駛的算法模塊通常分為 “感知” 、 “決策規(guī)劃” 、 “運(yùn)動(dòng)控制” 。其中,“感知”模塊是自動(dòng)駕駛的核心,大部分的技術(shù)升級(jí)都集中在感知模塊,其目的是讓車(chē)輛對(duì)駕駛環(huán)境的 “感知”達(dá)到人類感知的級(jí)別;而“決策規(guī)劃”則是基于“感知”模塊輸出的結(jié)果,通過(guò)規(guī)劃汽車(chē)行為和行車(chē)路徑,使得汽車(chē)達(dá)到指定目的地,且盡可能確保行車(chē)安全性、效率性和舒適性。
感知層面,特斯拉經(jīng)歷了由“特征提取網(wǎng)絡(luò)RegNet”向“BEV+Transfomer ” 、再向“BEV+Transfomer+Occupancy Network”轉(zhuǎn)變,決策規(guī)劃層面則自2021年由“Rule-based”向“Machine learning-based”逐步傾斜;直至2024年1月,特斯拉通過(guò)推出FSD V12 Beta,成為全球首個(gè)“端到端”神經(jīng)網(wǎng)絡(luò)量產(chǎn)上車(chē)的企業(yè),實(shí)現(xiàn)了感知、決策、規(guī)劃相融合。
算法4.0:Occupancy Network的應(yīng)用降低計(jì)算復(fù)雜性,時(shí)序信息的引入則將圖像識(shí)別推向4D
決策層面:2021年,特斯拉開(kāi)始在路徑規(guī)劃層面部分加入神經(jīng)網(wǎng)絡(luò)的元素,推出“蒙特卡羅樹(shù)搜索算法”,通過(guò)路徑選擇概率和局面評(píng)估來(lái)輸出決策;但該階段僅少部分使用神經(jīng)網(wǎng)絡(luò),大部分依然是人工規(guī)則代碼。2022年,新推出的“交互搜索網(wǎng)絡(luò)”將蒙特卡羅算法結(jié)合應(yīng)用到Occupancy網(wǎng)絡(luò)中,計(jì)算出的每個(gè)軌跡都會(huì)有一個(gè)成本函數(shù)來(lái)優(yōu)化樹(shù)搜索給出候選目標(biāo)較多等問(wèn)題,該函數(shù)取決于碰撞概率、舒適度、干預(yù)可能性和人類操作相似性這四大因素;交互搜索網(wǎng)絡(luò)成功將計(jì)算耗時(shí)從1到5毫秒降低到100微秒;但函數(shù)部分仍然是基于規(guī)則的代碼。
軟件方面:2021年馬斯克宣布FSD Beta編號(hào)從V8.1開(kāi)始。從大版本號(hào)升級(jí)來(lái)看,基本維持一年一更新的節(jié)奏;更新頻率來(lái)看,則呈現(xiàn)較為明顯的加速迭代,由期初的兩月一更,逐步演變?yōu)槊吭聝傻饺⑸踔撩吭滤母0殡S著測(cè)試范圍的擴(kuò)大及駕駛數(shù)據(jù)的增加,V9/V10/V11版本主要聚焦在功能的優(yōu)化上,不斷加深智能駕駛的擬人化程度。
HW3.0→HW4.0: 攝像頭數(shù)量新增50%,毫米波雷達(dá)以高精度4D版本回歸
此前棄用毫米波雷達(dá)的原因(1)一方面系傳統(tǒng)毫米波雷達(dá)低分辨率造成融合感知性能下降;特斯拉人工智能總監(jiān)曾表示,對(duì)于低分辨率雷達(dá)來(lái)說(shuō),通過(guò)類似立交橋這樣的場(chǎng)景時(shí),由于雷達(dá)的仰角分辨率很低,很難分辨出立交橋和下面停著的車(chē)輛,極易導(dǎo)致碰撞。(2)另一方面則系毫米波雷達(dá)信道數(shù)量限制了其感知能力的提升;相較而言,攝像頭能夠產(chǎn)生大量數(shù)據(jù),軟件的改進(jìn)可以使這些數(shù)據(jù)得到最大限度的利用。
而對(duì)于毫米波雷達(dá)的回歸,主要系(1)高精度4D毫米波雷達(dá)的分辨率大幅提升;2021年起,NXP、TI等雷達(dá)芯片方案商,以及大陸集團(tuán)采埃孚、博世等雷達(dá)系統(tǒng)供應(yīng)商都在加快推動(dòng)4D成像毫米波雷達(dá)的量產(chǎn)落地;新的4D毫米波雷達(dá)分辨率性能大幅提升,具備點(diǎn)云輸出(與視覺(jué)或激光雷達(dá)更好的融合,以及可能的分類識(shí)別能力)以及全天候等性能,成為了高階方案的選擇項(xiàng)之一。(2)能夠彌補(bǔ)純視覺(jué)方案的風(fēng)險(xiǎn);特斯拉被大眾詬病的“幽靈剎車(chē)”問(wèn)題(毫無(wú)征兆地剎車(chē)),主要系傳感器的感知缺陷造成的,由于夜間或大霧或大雨等惡劣天氣條件下、攝像頭的性能較差;同時(shí),攝像頭反應(yīng)時(shí)間通常也較毫米波雷達(dá)長(zhǎng),往往需要幾幀來(lái)識(shí)別物體的速度變化。而相對(duì)的,毫米波雷達(dá)根據(jù)發(fā)射頻率和接收頻率的差值測(cè)量距離、相對(duì)速度和方向,在夜間、逆光、霧、雨、雪環(huán)境下也能使用。
解析特斯拉FSD
受益于數(shù)據(jù)量、算力、硬件適配度方面的領(lǐng)先,特斯拉FSD的技術(shù)競(jìng)爭(zhēng)力較強(qiáng)
(1)數(shù)據(jù)量:AI模型的效果取決于輸入數(shù)據(jù)的數(shù)量及質(zhì)量,輸入的優(yōu)秀行駛數(shù)據(jù)越多,AI模型便能做出更適合、更優(yōu)異的行駛決策。FSD自2020年10月開(kāi)始北美地區(qū)內(nèi)測(cè),隨著FSD推送地區(qū)及推送用戶的增多,特斯拉擁有的行駛數(shù)據(jù)會(huì)呈指數(shù)級(jí)上漲;在數(shù)據(jù)量上,國(guó)內(nèi)廠商的追趕難度較高。2024年4月,特斯拉宣布其全自動(dòng)駕駛(FSD)技術(shù)助力下的汽車(chē)已經(jīng)行駛了超過(guò)10億英里、相當(dāng)于16.1億公里,而國(guó)內(nèi)廠商方面,暫無(wú)達(dá)到該里程數(shù)的企業(yè)。
2)龐大的算力中心:AI模型接受數(shù)據(jù)訓(xùn)練,是建立在算力平臺(tái)上的,其計(jì)算能力及算力投入都是關(guān)鍵指標(biāo)。 1)算力方面,小鵬基于阿里云打造的“扶搖”智能計(jì)算平臺(tái),算力可達(dá)600PFLOPS(每秒浮點(diǎn)運(yùn)算60億億次),而2022年特斯拉算力中心的算力已經(jīng)達(dá)到了 2 EFLOPS(每秒浮點(diǎn)運(yùn)算200億億次)。未來(lái),特斯拉自研超級(jí)算力平臺(tái)Dojo投入使用后,其算力還將上升一個(gè)臺(tái)階;根據(jù)特斯拉2023年6月發(fā)布的算力發(fā)展規(guī)劃,Dojo將在2024年10月達(dá)到100 EFlops算力。 2)算力投入方面,2022年特斯拉AI DAY上,馬斯克表示目前特斯拉擁有超過(guò)14000顆GPU的超級(jí)算力中心;2023年8月,特斯拉啟動(dòng)了10000顆H100 GPU的新訓(xùn)練集群,H100 GPU的運(yùn)算效能是前一代A100的五倍快,價(jià)格昂貴、單顆將近40000美元。與此同時(shí),算力平臺(tái)的后期維護(hù)成本還要遠(yuǎn)高于硬件成本;馬斯克曾公開(kāi)表示,2023年特斯拉花在擴(kuò)大訓(xùn)練運(yùn)算算力的預(yù)算就超過(guò)20億美元,并表示2024年會(huì)采取同樣的行動(dòng);相較而言,國(guó)內(nèi)廠商的算力投入與特斯拉仍存在較大差異。
(3)適配度高的自研硬件解決方案:特斯拉從2016年2月組建芯片團(tuán)隊(duì),到2019年4月成功推出FSD芯片,歷時(shí)三年之久推出HW硬件解決方案。自研的HW3.0是第一款完全出自車(chē)企的自動(dòng)駕駛硬件解決方案,同時(shí)也是量產(chǎn)車(chē)型上目前深度學(xué)習(xí)理論性能最強(qiáng)的方案;而目前,HW已經(jīng)進(jìn)化到了4.0時(shí)代。 自研硬件的優(yōu)勢(shì),首先是性價(jià)比高、利用率高,大幅降低FSD的硬件成本;其次是開(kāi)發(fā)自由度高,更能支持特斯拉的創(chuàng)新性算法及其他相關(guān)技術(shù)方案。相較來(lái)看,大部分國(guó)內(nèi)廠商采用外購(gòu)芯片方案,在適配度及利用率上,都與特斯拉自研硬件解決方案存在一定的差距