端到端催熟了智能駕駛體驗,處于智駕領域絕對頭部領先身位的小鵬汽車成功翻身,足以證明端到端的巨大優點。
但是,被國內車企吹上天的端到端也有一些不容忽視的缺點。
01
萬事萬物大都既有優點也有缺點,很多東西都是一把雙刃劍!
端到端重構了自動駕駛的技術棧,算法的全面AI化,使得數據成為驅動自動駕駛模型迭代的基礎養料。
從此,自動駕駛系統在一定程度上擺脫了傳統范式下有多少人工就有多少智能的尷尬,也杜絕了算法工程師有意無意埋一些bug的做法。
天道昭昭,人心可鑒,在裁員四起、人心惶惶的大背景下,理解一下程序員們養bug自重的無奈吧。

在給定參數量和模型架構的前提下,自動駕駛模型的能力完全取決于訓練的數據規模有多大、數據的質量有多高、分布性有多么豐富。
在規則+算法的范式下,自動駕駛系統尚有部分知識來自于人工設定的規則,到了完全轉向數據驅動的端到端范式之后,自動駕駛系統全面模型化,系統壓縮的所有駕駛知識完全來自訓練數據。
這就意味著,到了端到端時代,自動駕駛系統訓練的數據規模比海量更加海量了。
iPhone大屏化之后,宣稱“Bigger than bigger”,比逼格更逼格,華為引入全向防撞系統之后,宣稱“比安全更安全”,大家借此體會一下啥叫比海量更海量吧。

隨著智駕里程的增長以及自動駕駛系統能力的提升,訓練的數據量當然也會不斷增長。
如果非要刻舟求劍的話,蔚來截至今年4月份的視頻訓練量為1,000萬個clips,小鵬截至今年9月份的視頻訓練量為2,000萬個clips,特斯拉那么恐怖的訓練算力,至少5,000萬個clips。

以上說的只是訓練素材的數量單位,還得考慮訓練頻次和模型的迭代速度。
就跟學霸們通過反復刷題提升成績一樣,模型也是通過反復地訓練這些數據,才把駕駛知識訓練到模型的參數里面的。
特斯拉每天迭代一個小版本,假設需要訓練20個頻次,每天就得訓練10億個clips!
02
科學分析有兩種方式:定量分析和定性分析。
比海量更海量屬于定性分析,它可以給你一種模模糊糊的感覺,你盡可以根據自己的立場宣泄對端到端或褒或貶的情緒,不過,最終還是得進行定量分析,用真實的數據做嚴謹的對比。
看數據,特斯拉每天用5,000萬個clips訓練模型20個輪次,相當于訓練10億個clips,訓練算力有限,FSD模型迭代的速度就會減慢,特斯拉將“訓練算力”推高到100E的核心原因就在這里。

這個100E其實不只包括訓練算力,還包括推理算力,更為準確的說法是訓推一體的AI算力。
隨著數據標注工具推理能力的增加,過去主要依靠人工實現的數據標注工作逐漸得以自動化實現,數據標注效率大大提升了。
不過,和模型需要一遍又一遍地訓練一樣,訓練素材的精標結果也需要一遍一遍地刷出來,其結果就是,自動駕駛數據閉環中的自動標注過程需要消耗的推理算力也大大增加了。

也就是說,目前的自動駕駛數據閉環消耗的絕不僅僅是訓練算力,還包括推理算力,模型訓練階段消耗訓練算力,訓練之前的數據標注消耗推理算力,用的是不同的服務器。
之所以還在繼續沿用訓練算力這么一個術語,主要原因是是歷史沿襲的約定俗成,而且大部分人還沒有及時更新認知。

和分模塊時代主要在感知層面打標簽不同的是,到了決策層也要模型化當然也要做數據標注的端到端時代,視頻訓練片段的數據標注工作大大增加了。
這就意味著,端到端視頻訓練片段的數據標注工作量非常巨大。
特斯拉買英偉達H100做訓練,自家的Dojo做推理,玩的那叫一個溜!

而本土車企不只是訓練算力不足,捉襟見肘的推理算力更是被端到端需要的海量數據標注工作打了個措手不及!
03
最近大火的《黑神話 悟空》告訴我們一個深刻的道理;人生在世,最可怕的就是執念。
自動駕駛領域就有一撥人,始終心懷消滅激光雷達的執念。

他們始終認為,隨著視覺神經網絡訓練數據的增加、參數的加大、模型的優化,最終可以消滅激光雷達。
端到端方案出現之后,由于消除了大量的冗余模塊,實現了計算資源的集約化使用,端到端自動駕駛系統的參數量得以翻番。
視覺神經網絡能力迎來大幅度提升,他們更是覺得拿到了尚方寶劍,認為攝像頭可以將激光雷達斬于馬下了。

其實,端到端和純視覺與多傳感器融合之爭沒有什么關聯關系,即便是傳統的分模塊方案,拿掉激光雷達后,也可以拿節省下來的計算資源提高視覺神經網絡的參數量和性能上限。
之所以說端到端不排斥激光雷達,落腳點還是在安全上面。
激光雷達可以提供感知冗余,提升自動駕駛系統的安全,傳統端到端方案中的規劃控制網絡也需要規則兜底,來彌補安全下限低的缺點。
一個是感知冗余,一個是規控冗余,想一想,這里面是不是有個大哥不說二哥的道理。
技術的發展存在蹺蹺板效應,上限高固然是端到端方案的優點,下限低也是它的缺點。
正如Mobileye揭示的那樣,端到端方案在常規場景下具備更加優雅不慫、淡定從容的駕駛風格,可以實現更加舒適的駕駛體驗,但在非常規場景下,這種優雅不慫很可能轉成急躁冒動,帶來安全風險。

華為在它的分段式端到端網絡中,加入了與其PDP預測決策規劃網絡并行的本能安全網絡,很好地詮釋了“安全就是最大的豪華”的理念。

比亞迪也在它的分段式端到端方案BAS3.0中加入了類人類安全網絡,端到端負責詩與遠方,類人類安全網提供安全兜底保障。

如果說數據訓練和標注工作量巨大是甜蜜的煩惱的話,安全下限低便是端到端真正的缺點了。
在更好的訓練范式出現之前,以規則代碼或安全網絡兜底是不可避免的中間階段,某些車企的OneModel端到端聽聽就得了,切莫當真!