FSD來(lái)中國(guó),真會(huì)卡在電瓶車(chē)?不出意外,煥新Model Y會(huì)在今年3月上市交付,同時(shí),計(jì)劃在今年一季度內(nèi)落地的FSD,可能終于要來(lái)了。去年12月初,F(xiàn)SD從第12代系統(tǒng)更新到了V13.2,按照馬斯克的說(shuō)法,新系統(tǒng)的功能和體驗(yàn)和之前完全不同,是效果最強(qiáng)的版本,從海外實(shí)測(cè)結(jié)果來(lái)看,從識(shí)別準(zhǔn)確性到整套執(zhí)行邏輯,博弈方案確實(shí)都比以往更進(jìn)化,這也直接吊足了中國(guó)車(chē)主的胃口,那么,這套新系統(tǒng)在中國(guó)的智駕能力,大概在什么水平?和國(guó)產(chǎn)智駕技術(shù)比起來(lái),F(xiàn)SD真的在領(lǐng)先位置上?
不會(huì)避讓電瓶車(chē),硬件和軟件誰(shuí)出了問(wèn)題?
關(guān)于FSD V13.2的具體效果,之前我們?cè)治鲞^(guò),簡(jiǎn)單說(shuō)有2個(gè)細(xì)節(jié)做了較大優(yōu)化,一個(gè)是開(kāi)啟條件不再受限,一個(gè)是接管率降了10倍左右。就目前國(guó)產(chǎn)智駕技術(shù)的功能來(lái)看,像三點(diǎn)式掉頭,無(wú)保護(hù)左轉(zhuǎn),繞行、環(huán)島高效通行,城市或高速領(lǐng)航等,新版本的FSD基本也都有,似乎到了中國(guó)直接就能上路用,不過(guò),在最近一次的海外實(shí)測(cè)中,有人發(fā)現(xiàn)FSD V13.2遇到中國(guó)特有的三輪電瓶車(chē),通行率明顯受到影響,SR能識(shí)別到障礙物,并且選擇主動(dòng)停車(chē)禮讓?zhuān)瑳](méi)完全降級(jí),但需要接管完成人機(jī)共駕。
既然出現(xiàn)了corner case,那么在感知、規(guī)控、執(zhí)行的端到端架構(gòu)里,究竟哪個(gè)環(huán)節(jié)出了問(wèn)題?首先,F(xiàn)SD作為純視覺(jué)智駕技術(shù),感知架構(gòu)獲取環(huán)境數(shù)據(jù)的途徑,只有通過(guò)攝像頭來(lái)完成,目前FSD的構(gòu)成硬件條件,是HW四代芯片和7顆500萬(wàn)像素?cái)z像頭,芯片不用再贅述,7nm制程,20核CPU,內(nèi)存從LPDDR4升級(jí)到GDDR6,單顆算力720TOPS,視頻信號(hào)轉(zhuǎn)化數(shù)據(jù)的能力基本不存在難題,雙目攝像頭最大探測(cè)距離424米,比華為最新的192線激光雷達(dá)還遠(yuǎn)了將近一倍,36赫茲全分辨率視頻信號(hào)輸入,就是1秒能反復(fù)看36次視頻,總數(shù)據(jù)帶寬為每秒1.3千兆像素,以36赫茲運(yùn)行,捕獲和推理之間的數(shù)據(jù)基本不存在延遲,理論上講,F(xiàn)SD在2021年放棄激光雷達(dá)之后,感知架構(gòu)端對(duì)環(huán)境道路的數(shù)據(jù)處理能力,可以說(shuō)是能和傳統(tǒng)激光雷達(dá)做正面對(duì)比的。
所以,問(wèn)題還是出在了軟件層面上。大家都知道,F(xiàn)SD的感知模塊,是基于HydraNets架構(gòu)搭建的,簡(jiǎn)單說(shuō)就是整合了多個(gè)視覺(jué)識(shí)別任務(wù)到單一網(wǎng)絡(luò)上,通過(guò)以Transformer為主干網(wǎng)絡(luò)+BEV感知網(wǎng)絡(luò),從而實(shí)現(xiàn)對(duì)車(chē)輛周?chē)h(huán)境的感知,這也是目前國(guó)內(nèi)智駕系統(tǒng)的技術(shù)底層架構(gòu),但區(qū)別和核心,就在FSD用了Occupancy占用網(wǎng)絡(luò),準(zhǔn)確來(lái)講,這是一類(lèi)結(jié)合了語(yǔ)義分割和柵格占據(jù)地圖法的技術(shù),除了給圖像中的每個(gè)像素分配給一個(gè)3D占用特征,再將環(huán)境分多個(gè)柵格,并將每個(gè)柵格標(biāo)記為占用或空閑的方法,最終可以對(duì)環(huán)境進(jìn)行建模,并在此基礎(chǔ)上進(jìn)行路徑規(guī)劃等操作,聽(tīng)起來(lái)比較復(fù)雜,但我們劃個(gè)重點(diǎn),“3D占用特征”,最直白的話來(lái)理解,就是通過(guò)感知硬件架構(gòu),把世界環(huán)境分成無(wú)數(shù)個(gè)單元格,再根據(jù)障礙物的形態(tài)、體積,給到對(duì)應(yīng)的坐標(biāo)數(shù)據(jù),精度上甚至能做到厘米級(jí),沒(méi)錯(cuò),小米正在做的BEV變焦技術(shù),就和它有相當(dāng)類(lèi)似的效果,但,不同之處,就在于Occupancy網(wǎng)絡(luò)是可以不用像激光雷達(dá)做實(shí)時(shí)掃圖,或者反復(fù)深度學(xué)習(xí)做障礙物白名單標(biāo)定,只要系統(tǒng)識(shí)別到,就立馬能出數(shù)據(jù)結(jié)果,在CNN卷積神經(jīng)網(wǎng)絡(luò)的推演下,理論上說(shuō)有路沒(méi)路都能開(kāi)。
但,F(xiàn)SD來(lái)中國(guó)前,遇到國(guó)內(nèi)特有的電瓶車(chē)就罷工,難免產(chǎn)生了3個(gè)思考,1、入華后是否還得再教O(píng)ccupancy學(xué)習(xí)認(rèn)識(shí)一遍通用型障礙物?2、國(guó)內(nèi)電瓶車(chē)保有量超3億,路況復(fù)雜程度更高,整合國(guó)內(nèi)數(shù)據(jù)后,F(xiàn)SD做到適配上路大概要多久?3、一旦融入國(guó)內(nèi)道路數(shù)據(jù),大模型算法豈不是要超過(guò)北美版本?目前這三個(gè)問(wèn)題都不好回答,唯一能證明的,只有等Grok 3重推在國(guó)內(nèi)的端到端算法,而在這個(gè)過(guò)程之前,F(xiàn)SD至少得先拿到實(shí)測(cè)視頻數(shù)據(jù)才行,而推演后的新規(guī)控邏輯,不出意外最快也得超過(guò)2年,這似乎也就意味著,老車(chē)主花6萬(wàn)4買(mǎi)的這項(xiàng)功能,今年可能至少又要損失一半了。
FSD今年來(lái)中國(guó),至少5家車(chē)企不怕?
FSD帶著6萬(wàn)4的買(mǎi)斷價(jià)格,來(lái)到中國(guó)未必是最好用的,但也是享受門(mén)檻最高的。今年,國(guó)內(nèi)誰(shuí)是FSD的最大競(jìng)爭(zhēng)者,答案也不難找,有城區(qū)NOA,有智能泊車(chē),還有越來(lái)越低的接管率,甚至還有3萬(wàn)就能買(mǎi)斷的滿血高階智駕包,現(xiàn)在看來(lái)差不多已經(jīng)成為基礎(chǔ)的智駕核心功能,F(xiàn)SD來(lái)了也是一樣在做這些,唯獨(dú)價(jià)格更高。從去年開(kāi)始,包括華為GOD大網(wǎng),理想如今的E2E+VLM,越來(lái)越多的國(guó)產(chǎn)智駕方案并入無(wú)圖純視覺(jué)城區(qū)NOA,高線束激光雷達(dá)成本降到4位數(shù)后,整車(chē)價(jià)格也有了再將一些的可能,總之,今年的FSD,會(huì)在效果和成本上,沒(méi)國(guó)產(chǎn)技術(shù)更值。
回到技術(shù)本身來(lái)說(shuō),F(xiàn)SD的transformer+BEV架構(gòu),確實(shí)是給了現(xiàn)如今國(guó)產(chǎn)智駕方案的技術(shù)基底,但二者的出發(fā)點(diǎn)不同,也是注定了在不同地區(qū)的市場(chǎng)場(chǎng)景上,端到端效果有所不同。FSD就是典型的以技術(shù)出發(fā)的智駕系統(tǒng),而中國(guó)的端到端,純粹是從體驗(yàn)的維度來(lái)做,甚至不惜會(huì)加入規(guī)則和記憶來(lái)優(yōu)化。
舉個(gè)例子,前面提到的occ占用網(wǎng)絡(luò),讓FSD對(duì)環(huán)境推理的能力更強(qiáng),而國(guó)內(nèi)交通參與者極為復(fù)雜,更強(qiáng)調(diào)博弈能力,這不僅僅是在環(huán)境推理層面的思考,更多的也是在不影響通勤效率的同時(shí),給安全行車(chē)兜底,所以本質(zhì)上講,F(xiàn)SD和國(guó)內(nèi)的主流智駕技術(shù),沒(méi)有強(qiáng)弱之分,只有體驗(yàn)細(xì)節(jié)優(yōu)化上的不同,在Grok 3模型結(jié)合國(guó)內(nèi)數(shù)據(jù)之后,那時(shí)可能才會(huì)分出一波技術(shù)先進(jìn)性。
但還是要講,華為現(xiàn)在的GOD大網(wǎng)、理想的E2E+VLM,亦或者是蔚來(lái)還沒(méi)推送的NWM,基本都已經(jīng)有了下一步迭代的目標(biāo),也就是說(shuō),現(xiàn)在所謂的端到端(分段式),只是把感知和策劃放在了一起,極限少數(shù)的場(chǎng)景依然得靠規(guī)則驅(qū)動(dòng),而一體式大模型才是今后幾年內(nèi),整個(gè)智駕技術(shù)的發(fā)展趨勢(shì),F(xiàn)SD用occ網(wǎng)絡(luò)+深度學(xué)習(xí),成本在數(shù)據(jù)采集量和時(shí)間問(wèn)題,雖然能解綁車(chē)端算力要求,但真正考驗(yàn)的是背后的超級(jí)計(jì)算機(jī),在推理效率上的極限,這也是純視覺(jué)智駕的技術(shù)立足根本。
激光雷達(dá)方案正好相反,對(duì)車(chē)端算力平臺(tái)要求更高,而更高的算力,也意味著更容易處理復(fù)雜的場(chǎng)景,更何況,利用3D實(shí)時(shí)掃圖的特性給安全性兜底,一直都是國(guó)產(chǎn)技術(shù)的共識(shí),所以能和FSD對(duì)抗的車(chē)企,至少會(huì)有華為鴻蒙智行下的四界、小米、理想、蔚來(lái),以及擁抱國(guó)產(chǎn)智駕方案的奔馳、寶馬、豐田和本田。