「遙遙領先」的華爲智駕,最大的風險是什麼?
2024 年 3 月開始,特斯拉開始在北美地區大範圍推送 FSD v12,帶來了相當明顯的體驗升級,讓端到端成爲行業追逐的熱點。
近日,小鵬汽車創始人何小鵬在美國加州體驗了 FSD(全自動駕駛)V12.3.6 版本後,對其進步表示感慨。他稱,全程體驗下來,FSD 的表現非常絲滑,絕大部分路況處理都讓人安心,幾乎接近人類司機的駕駛水平。
與此同時,國內公司也在迅速跟進這條技術棧。華爲、小鵬、元戎啓行等企業紛紛規劃端到端的上車方案。
其中,華爲智能汽車解決方案 BU CEO 靳玉志表示,華爲 ADS(自動駕駛系統)的目標是超越特斯拉 FSD。他表示,接下來每次大版本更新都顯著提升了行業水平,即使是純視覺的方案要超越特斯拉 FSD,而帶激光雷達的方案更是要碾壓特斯拉。
最近,華爲宣佈,阿維塔將首批搭載華爲乾崑 ADS 3.0(高階智能駕駛),並宣佈大降價。ADS 高階功能包一次性購買標準價格爲 3.6 萬元,調整後價格爲 3 萬元,相比原價降低了 6000 元。
那華爲要如何在體驗上碾壓特斯拉 FSD 呢?在端到端成爲行業共識的背景下,華爲需要跨越哪些門檻才能繼續保持領先?更重要的是,在「遙遙領先」的背後,華爲智駕最大的風險是什麼?
01 大力出奇跡
在此之前,首先要回顧下華爲如何成爲智能駕駛第一梯隊?
業內普遍認爲有兩大原因:一是華爲在智能駕駛的起步早,可以追溯到 2013 年。當時,華爲成立了車聯網事業部,正式開始佈局自動駕駛技術。而在此之前,2012年穀歌獲得了第一張自動駕駛牌照。與百度在同一時期開始進行路測相比,華爲在時間上並沒有落後。
相比之下,目前一些備受矚目的自動駕駛公司,例如小馬智行、Momenta 等,都是成立於 2016 年。
另一種說法是得益於華爲龐大的資源投入和團隊規模。
在很長一段時間裡,在智能駕駛領域,團隊規模直接影響研發成熟度。尤其是處理大量的特殊情況(Corner Case),需要大量的程序員和測試工程師來開發和驗證。
問界產品搭載了華爲智駕系統 圖片來源:問界
相比規模在 1000 人左右的主流車企和自動駕駛公司研發團隊,華爲車 BU 的研發團隊總計達 7000 人。餘承東曾表示,其中 70%至 80%(約 5000 人)專注於自動駕駛的研發。這使得華爲擁有國內外規模最大的自動駕駛研發團隊。
知乎博主「卿顏」表示,華爲在研發和新技術上的投入力度和決心是業內少見的。華爲在多個團隊同時推進自動駕駛技術的研發,並擁有大量的測試車,其中主要使用的是價格昂貴、易於改造的車型,顯示出其在硬件上的投入。
在軟件方面,華爲曾是 Matlab(美國 MathWorks 公司出品的商業數學軟件,被稱爲「工科生必備神器」)的大客戶,購買了非常完整的許可證,甚至包括一些暫時用不到的許可證。華爲一年在 Matlab 上的花費可能超過多個大主機廠的總和。雖然目前由於禁令影響,情況有所變化,但華爲在軟件上的投入同樣顯示了其在技術研發上的決心。
與此同時,自動駕駛技術長期以來採用分治法,將過程分成感知、預測、規劃、控制,然後再拆分爲雷達、建模、車規標準、智能協同、高精地圖、軟硬件配合等多個組成部分。這種方法對習慣大兵團作戰的華爲研發團隊來說再熟悉不過了。
華爲在自動駕駛領域的研發過程,充分利用了其在大規模團隊協作和項目管理方面的經驗。分治法讓各個部門專注於各自的技術難題,同時確保整體項目的協調推進。
華爲 ADS 高階智能駕駛輔助系統的演示區 圖片來源:視覺中國
這幾種說法都有合理性,但不容忽視的是,華爲有來自其他業務的技術儲備。華爲並不是從零開始涉足自動駕駛。相比其他國內廠商,華爲在電驅動等汽車技術上有着深厚的積累。
同時,自動駕駛對軟硬件能力的要求極高。從芯片製造、算法優化到系統建立和軟件適配,每一個環節都需要紮實的技術積累。
目前,華爲的軟硬件一體化能力是支撐其快速發展的關鍵。與其他廠家通常購買各種器件芯片並結合自研算法不同,華爲不僅開發底層操作系統,還擁有獨特的 AI 芯片、激光雷達、電機、電控系統和毫米波雷達等關鍵技術。簡單說,一輛智能電動車除了輪子、外殼和座椅,其他所有技術華爲都能提供。
這種一體化優勢,使得華爲在優化各類器件性能和數據處理方面,具備了極高的效率和靈活性。
02 能跨越到端到端時代嗎?
目前,業界普遍認爲端到端開啓了新一輪的自動駕駛產業革命。華爲的高級智能駕駛系統也經歷了三個階段:
ADS 1.0:於 2021 年推出,基於 Transformer 的 BEV 架構,依賴高精度地圖。
ADS 2.0:在 2023 年發佈,減少了對高精度地圖的依賴,採用 RCR 算法進行車道實時識別和路徑規劃,大幅提升了系統在城市環境中的泛化速度和更新頻率。
ADS 3.0:2024 年發佈,採用端到端大模型。與特斯拉宣稱的「大一統」模型不同,華爲 ADS 3.0 感知部分使用 GOD(通用障礙物識別)大感知網絡,而決策規劃部分通過 PDP(預測-決策-規劃)網絡來實現。
雖然業內都在追逐端到端,但業界對它的定義存在着分歧和爭議。一些技術原教旨主義者認爲,許多公司所宣傳的「端到端」並非真正意義上的端到端;而實用主義者則認爲,只要技術基本符合原理並且產品性能得到提升,精確定義端到端的內涵並不是關鍵。
辰韜資本聯合多家單位發佈了 2024 年度《端到端自動駕駛行業研究報告》,表示自動駕駛技術架構演進爲四個關鍵階段:
感知「端到端」:感知模塊通過多傳感器融合技術實現了模塊級別的全面覆蓋,但決策規劃仍主要基於規則。
決策規劃模型化:決策規劃模塊從傳統的預測、決策、規劃功能分離,演變爲集成到單一神經網絡中的模型。
模塊化端到端:感知模塊不再輸出人類理解的結果,而是特徵向量;訓練時需通過梯度傳導同時進行,增強模塊之間的協同性。
One Model/ 單一模型端到端:不再區分感知、決策規劃等功能,整體流程由同一深度學習模型完成,從輸入信號到輸出軌跡一體化。
業內認爲,華爲和很多國內廠商的方案,大多處於「 決策規劃模型化 」 階段,距離模塊化端到端或 One Model 端到端自動駕駛量產落地還有距離。
未來,華爲在邁向端到端自動駕駛新時代時,面臨着三大關鍵挑戰:
首先是數據需求的激增。特斯拉從超過 20 億英里(約合 32 億公里)的行駛數據中挖掘了數萬小時的視頻數據用於 FSD 訓練。一位自動駕駛工程師表示,他們在訓練端到端模型時,原本積累的路測數據只有 2%可以用。這顯示出端到端模型對數據量的龐大需求。
除了數據量,數據質量同樣至關重要。小馬智行的 CTO 樓天城曾表示,要訓練出高性能的端到端模型,數據質量的要求比一般性能模型高出幾個數量級。這是整個自動駕駛行業面臨的重大挑戰之一。
華爲今年 4 月時候宣佈,到 6 月訓練算力將達到 3.5 EFLOPS 圖片來源:華爲
第二、在端到端自動駕駛的發展過程中,訓練算力的需求越來越高,遠超以往任何階段。
部分業內人士認爲,使用 100 張高算力 GPU(如 NVIDIA A100)就能開始端到端自動駕駛的初步訓練。然而,特斯拉等領先企業的實踐表明,要實現優異的端到端效果,所需的計算能力遠遠超出這個數量。特斯拉此前預計 2024 年 2 月公司算力規模將進入全球前五,10 月算力將達到 100 E FLOPS(每秒浮點運算次數),相當於約 30 萬塊英偉達 A100 的算力總和。
相比於國內廠商,特斯拉的目標高得讓人驚訝。華爲表示,2024 年 6 月智駕 ADS 訓練算力將達 3.5EFLOPS,蔚來、理想、小鵬的智駕算力中心算力分別是 1.4 EFLOPS、1.4 EFLOPS、0.6EFLOPS。
第三,端到端將帶來自動駕駛團隊的組織重塑。一般來說,企業的組織結構通常能夠促進組件層面的創新,因爲產品研發通常由多個小組分別研究,只要產品的基本結構不變,這種方式就非常有效。然而,當需要進行結構性技術變革時,這種組織體系可能會阻礙創新,因爲它限制了人員和團隊以全新方式進行交流和合作的能力。
隨着端到端技術的使用,之前的分治法和KPI分拆模式可能會限制性能的提升,產生意想不到的反效果。過於關注單一 KPI 的優秀表現,可能會犧牲其他指標的穩定性。
因此,許多企業正在調整策略,減少原有團隊規模,轉向 AI 大模型和數據基礎設施的開發。高質量的數據和頂尖的 AI 人才將成爲關鍵資源。與此同時,以往的垂直組織體系,要轉向網格狀結構,同時擁有垂直和橫向團隊,以實現多目標優化而非單一目標的優化。
端到端神經網絡架構提升了數據及 AI 能力在整個產業鏈上的重要性,並帶來了企業所需能力和資源投入的深刻變化。這也意味着,智能駕駛的遊戲規則重新改寫,能夠跟進這場競賽的玩家屈指可數,許多公司將因此掉隊。
華爲在規則驅動時代確實有自己的資源和先發優勢,但跨越要端到端時代保持領先,轉彎的半徑要比友商大很多。
本文源自:極客公園