車企得了AI病:月砸上億拼智駕算力

文丨李安琪

編輯丨李勤

“下半年開始,理想幾乎把渠道商手裡的卡都買了。”一位知情人士說。

AI大模型創業催生的搶購算力潮,今年陡然遷移到了汽車行業。以理想、華爲和小鵬汽車爲首,向端到端智駕發起猛衝的公司,尤爲激進。

和AI大模型技術趨同,端到端的智能駕駛技術,同樣有數十億參數,也在向百億級進發。算力就是這座數據熔爐的燃料。這也決定,端到端技術和算力資源拼搶,成了智能駕駛新的決勝規則。

“李想(理想汽車CEO)經常問我,算力資源夠不夠,不夠再去買。”接受36氪專訪時,理想智能駕駛副總裁朗鹹鵬曾表示。據36氪瞭解,目前理想汽車已經囤夠了萬張算力卡,“同時還在物色數據中心的地址。”

7月,理想的雲端算力爲2.4 EFLOPS ,到8月底,理想算力已經陡增至5.39 EFLOPS。幾乎一個月時間,理想的雲端算力增加了近3 EFLOPS。

同樣,小鵬汽車宣佈,到2025年,雲端算力將從目前的2.51 EFLOPS增加到10 EFLOPS。

華爲智駕也在兩個月內迅速將雲端訓練算力規模從5EFLOPS擴張到7.5 EFLOPS。

這是什麼概念?有智駕行業人士告訴36氪,目前車企們使用的訓練顯卡主要是英偉達H100和A800。美國禁令後,市場上能流通的大多是A800。

據36氪汽車瞭解,一臺A800服務器(含8張顯卡)報價約爲95萬元。按照FP16精度計算,單張A800的算力爲320TFLOPS,1 EFLOPS(等於1000000TFLOPS)大約可計算爲3125張A800,即390個8卡模組。

按每8卡模組按照95萬元價格計算,1 EFLOPS算力大約需要約3.7億元。

也就是說,理想汽車在過去1個多月,僅囤置算力芯片就耗費超10億元,而小鵬想要實現明年總算力目標,則需要耗費約37億元。

雖然耗資巨甚,但不容車企懈怠。智能駕駛技術已經在AI大浪潮下,發生新的範式革命:從傳統方案的規則驅動,變成了“端到端”方案的AI驅動、數據驅動。

想要量產端到端的智能駕駛產品,車企們需要先成爲吞噬海量數據、巨大雲端算力的猛獸。

特斯拉先成爲“算力狂魔”。去年9月,特斯拉AI訓練芯片儲備不過萬張左右,而在今年三季度財報會數字顯示,目前特斯拉AI算力約等效爲6.75萬張英偉達H100芯片。一年時間算力儲備翻超6倍。

圖源:特斯拉官網

這是相當恐怖的數字。目前特斯拉總算力約爲67.5 EFLOPS,對比之下,去年全球算力總規模爲910 EFLOPS。

但在海量數據餵養和超大算力訓練下,特斯拉基於端到端的FSD v12版本,提供了比以往更絲滑、擬人的智駕能力。這也誘使汽車行業進入這場數據和算力遊戲。

車企患上數據飢渴症

端到端下的智能駕駛技術,是數據和算力的合謀。

對於端到端智駕所需要的數據,特斯拉曾給出過一些判斷標準:一個端到端自動駕駛訓練至少需要100萬個、分佈多樣、高質量的clips(視頻片段)才能正常工作。到了1000萬個case後,系統能力會變得難以置信。

有行業人士告訴36氪,一般1個clip在15-30秒左右,沒有絕對固定的時間長度。

特斯拉有相當明顯的數據優勢。目前特斯拉已經在全球賣出700萬輛車,即便有效的數據車輛爲百萬輛,如果單車每天貢獻一個clip,那麼特斯拉每天就有百萬個clips能被拿來訓練。

也有行業人士向36氪假設,假如在雲端訓練一個80 億參數的模型,至少需要在這個模型“煉丹爐”中投入1萬個小時訓練數據,並且每兩週更新要更新一遍數據。

越早建立數據驅動的智駕閉環,車企的技術與產品壁壘就越厚,也越有機會將後來者拒之門外。

理想表示,最晚明年年初,會推出大概通過超過1000萬clips訓練出來的端到端+VLM。前段時間小鵬智駕負責人李力耘也在公開表示,小鵬端到端模型的訓練數據量已達到2000萬clips。

但高質量數據並不容易尋得。馬斯克曾表示,有效的用戶干預行爲(高價值的訓練數據)捕捉正變得越來越難。“每行駛 10000 英里,只有 1 英里對訓練 FSD 神經網絡有用。”

理想也表示,目前超80萬輛車主,但真正能提供高質量數據的用戶只有3%。

多位智駕行業人士告訴36氪,目前車企和智駕公司獲取數據主要有2種方式。

一是從量產車上挖掘。比如針對車企賣出的幾十萬臺車,工程師會寫下專門規則,如果用戶的駕駛行爲符合條件,特定數據(經過脫敏處理)會被上傳。車企用戶也可以主動上傳一些特別案例。

而智駕供應商,也許在量產車數據回傳上沒有優勢,但內部往往會組建一支能優質駕駛的車隊,專門路跑採集數據。

數據回傳本身是一筆不小的成本。據36氪汽車瞭解,一家頭部智駕供應商公司,每年回傳數據的流量費以億元爲單位。如果是新造車公司,這項費用支出會更高。

二是在存量數據中挖掘數據。在早期智駕還不成熟的階段,車企和智駕公司往往積累大量數據,很多都是無效數據,工程師只能通過一些算法規則來挖取。

高質量數據作爲養料,會決定智駕系統迭代的質量。這持續考驗着車企的智駕自動化閉環能力:從數據採集、數據清洗、標註、訓練、仿真驗證、發版、解bug,再經歷新一輪閉環。

而這背後每一步的數據流轉,都在吞噬算力資源。車企和智能駕駛技術公司們,似乎難有退路。

智駕要賣錢,“端到端”雖難必做

端到端智能駕駛帶來的收益正在觸手可見。

在2023年末推出基於端到端的FSD後,馬斯克曾發郵件督促一線銷售讓更多用戶體驗智駕的擬人能力,原因是FSD的體驗變得更好了。

今年以來,特斯拉甚至採用了全員免費限時使用(北美地區)、訂閱費從199美元/月下降至99美元/月,買斷費用從1.2萬美元下降至4500美元等方式,來提升FSD的滲透率。特斯拉還表示FSD將於明年一季度在中國落地。這將有另一番商業想象空間。

換句話說,“端到端”讓智駕比過往任何時刻都接近商業化。

在國內,“端到端”也在加速智駕商業化進程。

華爲最早嚐到智駕商業化甜頭。去年末,華爲與賽力斯合作的問界新M7,上市兩月餘斬獲10萬個訂單,智駕版用戶超60%。

除了推出智駕版車型,華爲還通過智駕軟件包的方式進一步收費。而目前行業大多數車企智駕軟件都是免費開放給用戶。

跟特斯拉降價促銷不同,華爲智駕軟件費用正在逐步上漲。有鴻蒙銷售人士告訴36氪汽車,華爲智駕ADS 1.0階段買入價格是3000元,ADS2.0階段買入是6000元,ADS3.0是1萬元。“後續價格還會漲。”

而ADS 1.0到2.0到3.0版本,正是華爲從傳統多模塊智駕逐步轉向了端到端智駕後,帶來的技術和產品體驗提升。

另一個嚐到智駕技術紅利的選手是理想。在增程+家庭車產品力足夠打動用戶的前提下,理想從今年開始猛追補足智駕短板,其端到端智駕版本已經全量推送給所有車型MAX版本,智駕口碑回升。

今年二季度財報電話會議上,理想汽車稱其30萬以上的車型AD Max(即智駕版本車型)訂單佔比接近70%。而AD Max版車型比AD Pro版車型貴2萬元。用戶爲更貴的車型買單,實際上也是在爲智駕買單。

美國作家菲利普·迪克曾在小說《仿生人會夢見電子羊嗎?》中描述,仿生人擁有感情、會做夢,並希望擁有一隻活寵物。

端到端加持下,智駕系統可能已經開始“夢”到電子羊。但電子夢境的維持,需要大量資源灌注,車企與智駕公司也由此患上了數據、算力飢渴症。

算力遊戲,買卡建機房

除了賣車獲取更多數據養料,車企智駕團隊還在籌備芯片算力資源。

特斯拉三季度財報電話會數據顯示,目前特斯拉AI算力約等效爲6.75萬張英偉達H100芯片,總算力約爲67.5 EFLOPS。

特斯拉稱,到10月底,特斯拉還將增加2.1萬張H100,可大致推測出,特斯拉屆時總算力將達88.5 EFLOPS。

除了瘋狂購入英偉達顯卡之外,特斯拉自研的芯片也在路上。馬斯克此前在X上發帖稱,其超級計算機Dojo 1到年底,將會有約8000臺H100 GPU提供等效的訓練能力。特斯拉此前期望是,Dojo進入投產後,其算力集羣總規模能達到100 EFLOPS。

望不見頂的算力儲備,讓國內車企玩家不敢輕易掉隊。

不過芯片限售後,英偉達的高端AI芯片H100難以在國內流通,國內企業更容易買到的,是英偉達針對中國市場推出的特供版芯片A800等,性能與價格都不如H100。

目前,華爲智駕是國內算力儲備最高的玩家,達7.5 EFLOPS。有華爲人士告訴36氪,內部不僅使用英偉達的訓練芯片,同時還在使用華爲自研的晟騰芯片,兩者混合使用。晟騰工具鏈雖然不算特別好用,但由於自研的緣故,供給充足,華爲能在雲端算力上進展很快。

理想汽車則以5.39 EFLOPS 位居華爲之後。而這背後,是萬張左右的英偉達顯卡儲備。

有行業人士給36氪算了一筆賬:以A800芯片爲例,按照深度學習訓練一般適用的FP16精度來計算,單張A800算力爲320 TFLOPS,那麼5.39 EFLOPS算力實現,需要超1.68萬張A800。(理想不完全是A800,此處僅大致計算,1EFLOPS=1000PFLOPS=1000000TFLOPS)

有行業人士告訴36氪,今年AI大模型公司算力搶購熱潮消退後,雲端訓練顯卡相對好買。去年A800的8卡模組價格輕鬆賣超百萬元,如今回落到95萬元左右。即便如此,國內車企玩家想要囤積算力,依然是一筆鉅額投入。

理想的目標是年底達到8EFLOPS。據36氪瞭解,理想此前已經與雲廠商火山引擎聯合建立數據中心,但目前還在籌備新的數據中心選址。

小鵬智駕中心算力則是2.51 EFLOPS,同理可換算爲超7800張A800,小鵬的目標是2025年算力將達10 EFLOPS 以上。蔚來目前的雲端算力是1.4 EFLOPS,可換算爲超4300張A800。

可以對比的是,據工信部信息,截至2024年6月,國內算力規模達246 EFLOPS(基於FP32計算)。如果換算成FP16,即492EFLOPS。而華爲、蔚小理4家企業雲端算力總和,就佔全國算力規模約3.5%。

但端到端不僅是巨頭的遊戲,中小玩家也在擠進圍場。智駕供應商往往聯合車企快速攻入戰場,比如出現了智己與Momenta、長城與元戎啓行等組合。

據36氪汽車瞭解,一些頭部智駕供應商的訓練芯片也達千張級別。如Momenta、地平線等去年就跟火山引擎達成合作,訂單在億元級別。

過去兩年,全球都陷入了AI大模型瘋狂狀態。國內AI大模型公司的創業入場門票高達5000萬美元,目前估值最高的大模型公司“月之暗面”身價已經去到236億元。

目前國內頭部AI大模型公司正朝着萬億參數量模型發展,這背後也需要巨大的算力池支撐。階躍星辰,Kimi等大模型公司,都在通過與雲廠商合作來搭建萬卡集羣訓練。

如今同樣的局面在汽車行業上演。車企們不甘心只賣車,而是朝着AI科技公司的方向進發。車企們天然擁有海量數據資源,在大模型大算力的加持下,目光已經投向了更廣的無人車、具身智能等方向。

他們需要在微薄的利潤水平下,投入巨資,競逐越來越高的算力數字。這能持久嗎?汽車行業正陷入價格鏖戰,如果把AI作爲決勝籌碼,這場“經費在燃燒”的算力遊戲纔剛剛開始。