在Robotaxi上,Waymo 在下象棋,而特斯拉還在下跳棋

特斯拉的粉絲們,以及埃隆·馬斯克本人,都表達了對FSD前景的興奮。特斯拉在3月份發佈了該軟件的重大升級版本V12.3,隨即又在4月宣佈將推出Robotaxi。上週,馬斯克宣佈FSD 的V 12.4版本也即將推出,並將“MPI數值提高5-10倍”。

但我認爲,期待特斯拉快速推出Robotaxi服務的粉絲們,將會感到失望。

在 3 月底前往舊金山的一次旅行中,我分別嘗試了特斯拉和Waymo 的最新自動駕駛技術。

在 Model X 的 45 分鐘試駕過程中,我不得不兩次干預以糾正 FSD 的錯誤。相比之下,我乘坐無人駕駛 Waymo 車輛兩個多小時,沒有發現任何錯誤。

因此,雖然特斯拉的 FSD 12.3 版本似乎比之前的版本有了顯著改進,但從直觀體驗來看,它顯然仍落後於 Waymo。

然而,Waymo 的出色表現也伴隨着一些瑕疵:雖然其行程實現了無人駕駛,但有時會有遠程操作員爲車輛提供指導(Waymo 拒絕告知在我乘坐的途中是否有遠程操作員干預,或者干預的頻率如何)。

其次,特斯拉的 FSD 適用於所有道路類型,但 Waymo 的出租車卻避開了高速公路。

許多特斯拉粉絲將這些限制視爲 Waymo 正走向技術死衚衕的跡象,他們認爲FSD 能夠在所有城市和道路上運行,是一種更通用的技術,很快就會超越 Waymo。

但這從根本上誤解了情況。

在公共道路上安全運行無人車非常困難。由於駕駛座上沒有人,任何一個錯誤都可能致命——尤其是在高速公路上行駛時。

因此,2020 年,Waymo 在它能找到的最簡單的環境——鳳凰城郊區的住宅街道,推出了無人駕駛服務,並且隨着對其技術的信心增強,難度也在逐漸提高。

相比之下,特斯拉尚未開始無人駕駛測試,因爲其軟件尚未準備就緒。目前,由於特斯拉車輛中有駕駛者存在,地理限制和遠程協助都不需要。但我預測,當特斯拉開始向無人駕駛轉型時,它會意識到只能像 Waymo 那樣逐步推進。

目前,Waymo 遙遙領先,它正在應對特斯拉甚至還沒有開始考慮的挑戰。如果說Waymo 在下國際象棋,而特斯拉則仍在下跳棋。

特斯拉比 Waymo 落後幾年

目前人們圍繞FSD 的興奮,讓我想起了 2018 年圍繞 Waymo 的炒作。那年,Waymo 宣佈從捷豹購買20,000 輛 I-Pace 轎車, 並從菲亞特克萊斯勒購買62,000 輛 Pacifica 小型貨車。

但Waymo於當年年底推出的服務卻令人失望——大多數行程仍由安全員駕駛,而且只有經過精心挑選的乘客才能使用。

直到 2020 年 10 月,Waymo 終於在鳳凰城推出了向公衆開放的完全無人駕駛出租車服務。不過即使在那之後,Waymo 的擴張仍然緩慢。

Waymo於 2023 年開始,在舊金山提供商業服務,目前正在擴展到洛杉磯和奧斯汀。如今,該公司的商業運營車隊只有幾百輛車,遠少於六年前規劃購買的 82,000 輛汽車。

到底出了什麼問題?在 2018 年 8 月的一篇文章中,記者阿米爾·埃弗拉蒂 (Amir Efrati) 報道了 Waymo 技術的侷限性。

埃弗拉蒂寫道:“Waymo 的Robotaxi在鳳凰城遇到無保護左轉,或交通擁堵時,曾多次遇到麻煩。”此外,“無人駕駛汽車很難將成羣結隊的行人或騎自行車的人分開,尤其是在購物中心或停車場附近的人羣。”

另一方面,我 3 月份試用的 FSD 版本,顯然還未準備好進行無人駕駛操作。例如,我不得不進行干預以防止 Model X 撞上塑料車道分隔線,而 Waymo 在 2020 年已不會再犯這樣的錯誤。

根據這些體驗來看,雖然 FSD 12.3 似乎優於 Waymo 在 2018 年左右的技術,但它還不如 Waymo 在 2020 年底的技術。

Waymo依賴遠程操作員

在早期,Waymo 的所有測試都是由安全員進行的。當軟件出現錯誤時,他們會進行干預,然後仔細記錄情況,工程師則利用這些場景數據來改進軟件。

自動駕駛軟件越好,這種測試策略的成本就越高——如果自動駕駛軟件每 50 英里出錯一次,安全員可能會在一天內遇到多個錯誤。但如果軟件每 5000 英里才犯一次錯誤,安全員可能需要花費數週的時間來獲取一份錯誤報告,費用由公司承擔。

如果 Waymo 繼續使用安全員進行測試,直到其軟件被證明比人類駕駛員更安全,那麼成本將高得令人無法接受。因此,Waymo 開始部署由遠程操作員支持的Robotaxi。

Waymo對其Robotaxi進行了編程,使其默認行爲極其謹慎——如果不能 100% 確信可以安全行駛,它就會減速停車並請求遠程協助。

理論上,該軟件的平均置信度會隨着時間的推移而提高,車輛需要遠程協助的頻率也會越來越低。

Waymo表示,遠程操作員從不直接駕駛其車輛。相反,操作員會回答問題並提供提示,以引導車輛朝正確的方向行駛。

例如,如果Robotaxi被對面駛來的一輛大卡車擋住了,遠程操作員可以指引車輛擠進右車道,給卡車留出通過的空間;再比如,如果一輛Robotaxi正在接近有多輛消防車的十字路口,車輛向遠程操作員詢問 “緊急車輛是否阻塞了所有指示車道?”和“道路是否封閉?”的類似問題,以獲得指引。

這種策略在高速公路上會變得棘手——如果Robotaxi請求幫助但沒有得到及時響應,則需要停下等待,這在高速公路上很難做到。

因此,儘管 Waymo 已經在高速公路上(配備安全員)測試了十多年,但完全無人的Robotaxi尚未在此運營。

三月,我乘坐Robotaxi從舊金山市中心來到Bayview 附近的一家麥當勞。全程花費28分鐘。如果使用Uber 或 Lyft 司機,可以走 101 號高速公路, 大約 15 分鐘即可到達。

Waymo正在努力解決這些問題:一月份,該公司開始在鳳凰城地區的高速公路上測試無人駕駛操作。如果測試順利,Waymo 可能會在未來幾個月內,爲其商業車隊啓用高速公路駕駛。

根據 Waymo 公佈的統計數據,至少從安全角度來看,其謹慎作風效果顯著。在 Waymo 的最初 700 萬英里無人駕駛里程中,其車輛發生致人傷亡事故的頻率約爲同類人類駕駛員的四分之一。

特斯拉有更好的方法嗎?

許多特斯拉粉絲認爲 Waymo 當前服務的侷限性——避開高速公路、依賴遠程操作員,以及僅限於少數大都市地區等等,都表明 Waymo 的技術存在根本缺陷。

去年,一位特斯拉支持者在一條推文中指出,Waymo 和通用旗下的Cruise“開發出了極其狹窄、非常脆弱、無法擴展的技術”。

馬斯克回覆說:“是的,對當地條件來說非常脆弱,且無法擴展。”

該論點的一個關鍵部分,與神經網絡有關。 Waymo 始於15年前的 Google 自動駕駛汽車項目,當時正值 2010 年代深度學習革命前夕,其軟件的最早版本可能使用手工編碼規則而非機器學習。一些特斯拉的支持者似乎認爲, Waymo 仍在使用同樣過時的技術。

事實上,Waymo 已經廣泛使用神經網絡。

在 2024 年 2 月的演講中,一位 Waymo 工程師解釋了該公司如何使用 Transformer來預測其他車輛的行爲。該公司十年前的軟件堆棧可能很脆弱,但它並沒有停滯不前。

另一方面,導致自動駕駛困難的一個重要因素,正是“長尾問題”。構建自動駕駛技術的公司需要進行數百萬英里的測試,以儘可能多地發現這些“邊緣情況”,這也是特斯拉比 Waymo 更有優勢的地方。

正如我們所看到的,Waymo 必須爲長期的監督測試向安全員支付費用。相比之下,特斯拉已說服數千名客戶免費測試其FSD軟件。事實上,客戶還爲這種“特權”支付了數千美元!

這讓特斯拉能夠獲得幾乎無限的數據。理論上,更多的數據應該能讓特斯拉有效地識別其自動駕駛軟件需要處理的邊緣場景,更多的數據也應該能讓特斯拉訓練出更好的神經網絡。

雖然獲取更多數據肯定是有幫助的,但這並不是靈丹妙藥。一個問題是特斯拉收集的數據沒有標籤,而Waymo 的安全駕駛員會記錄每次脫離的情況,以幫助識別 Waymo 軟件中的缺陷,但特斯拉客戶不太可能這樣做。

另一個問題是,某些邊緣場景比其他情況更難處理。

“第一響應者”問題

讓我們以警察與消防員的互動爲例——這是 Waymo 和Cruise 去年遇到的一個難題:

根據舊金山消防局的記錄,幾輛Robotaxi堵塞了狹窄的道路,迫使消防車繞道前往火場; Robotaxi被困在消防作業區域附近,迫使消防員在放置軟管和梯子時必須在它們周圍工作。

問題不在於這些車輛撞上了消防車(特斯拉過去曾 遇到過這樣的問題)。而是它們太過謹慎,以至於被困住了。這就是爲什麼這些事故只有在 Waymo 和 Cruise 開始無人化運營後,才成爲人們關注的問題;安全員不再能夠及時進行干預。而在這一方面,每輛特斯拉汽車都有人駕駛,如果 FSD 被困住,可以接管。

大多數時候,駕駛需要遵循簡單、確定的規則:留在車道中心、避免撞到其他道路使用者、遵守停車燈和道路標誌等等。

但穿越火災或車禍現場要困難得多,這些場景需要的推理能力遠遠超出當今人工智能系統的能力。因此,緊急場景很可能在未來幾年內,都是特斯拉 FSD 的“極端情況”,就像 Waymo 一樣。

在這一點上,Waymo的Robotaxi可以請求 Waymo 遠程操作員提供指導,急救人員可以靠在車裡與遠程操作員交談,也可以跳進車裡自己駕駛;市政府官員可以建立地理圍欄,讓 Waymo 車輛遠離緊急場景。

Waymo 已爲鳳凰城、舊金山和其他地方的數千名急救人員提供瞭如何與其車輛互動的培訓,這些努力也似乎正在取得成效。

《舊金山紀事報》在二月份的一篇報道中表示,自八月份以來,消防隊員提交的有關車輛行爲不當的報告有所減少。雖然部分原因是Cruise 於 10 月停止了在舊金山的運營,但 Waymo 的報告數量似乎也在下降。

如果特斯拉推出可實現完全無人駕駛操作的FSD 更新,我預計我們會開始看到其重複與去年 Waymo 和 Cruise 類似的失誤:碾過軟管、 阻擋救護車、 無視警察的指示、 干擾消防員的梯子放置等等。

鑑於其車隊規模,特斯拉可能面臨比Waymo 和 Cruise 更嚴重的來自急救人員的強烈反對。而且正如 Waymo 和 Cruise 發現的那樣,警察和消防員具有很大的政治影響力。

如果特斯拉真想提供無人駕駛出租車服務,它將需要Waymo 近年來一直在建設的那種基礎設施和支持服務。這包括車輛被困時進行干預的遠程操作員,以及與當地政府合作的人員。

然而,特斯拉卻在朝着相反的方向前進。《The Information》上個月報道稱,特斯拉正在解散其政策團隊。

服務不能僅靠軟件

今天的FSD 是一款軟件產品,但Robotaxi 服務遠不止軟件。這裡有一個簡單的例子:如果特斯拉Robotaxi爆胎了怎麼辦?

特斯拉設想的未來是,人們購買特斯拉,然後通過特斯拉運營的網約車平臺將其出租。

所以從理論上來說,特斯拉可以說爆胎是車主的問題,但這在實踐中是行不通的——車主可能正在開會,甚至正在度假。當特斯拉試圖聯繫車主時,讓一輛Robotaxi在路邊滯留幾個小時(可能裡面有乘客)是不可接受的。

因此,如果特斯拉想進入出租車業務,就需要一批移動技術人員來營救陷入困境的車輛。這些人可能是特斯拉員工或獨立承包商,但在公司開始在特定區域提供服務之前,就需要做好安排。

這意味着特斯拉可能會逐步“開城”。這樣做也是合理的,這不僅能讓特斯拉有時間向當地官員介紹自己,還能爲當地警察和消防部門提供培訓。

有了數據和算力,也並非萬能

我與很多特斯拉粉絲交流過,所以我很清楚他們會說什麼。他們會認爲我低估了特斯拉所投入的數據和計算能力,及其迭代速度。

一些特斯拉的支持者喜歡引用裡奇·薩頓的文章《痛苦的教訓》。 薩頓認爲,AI研究人員歷來花費太多時間試圖手動編碼,以找到解決圖像識別等問題的最佳方法。但最終,人們是通過在大量數據上訓練的通用學習算法,獲得了更好的結果。

薩頓在 2019 年寫了他的論文。從那時起,大語言模型的成功以驚人的方式展示了他的洞察力。

早期的AI研究人員會嘗試理解自然語言的屬性,然後將他們的見解編碼到人工智能系統中。而效果更好的方法,是採用 Transformer 架構,並將其擴展到數千億個參數,以創建像 GPT-4 這樣的 LLM。

馬斯克認爲,同樣的動力將有利於特斯拉的自動駕駛技術。他將FSD V12描述爲使用了“端到端神經網絡”,並正在投資數十億美元購買硬件,利用大量數據來訓練這些神經網絡。如果你相信薩頓的觀點,你可能會認爲特斯拉會超越Waymo。

但我認爲人們對薩頓的觀點做了過度解讀——他的本意是,經過大量數據訓練的大型神經網絡,往往比手工編碼的AI 系統表現更好。但這並不意味着向任何特定神經網絡投入更多數據和算力,就能隨意實現高水平性能。

LLM就是一個有力的例子——LLM會產生“幻覺”,也無法完成諸如計數物體 和 讀取模擬時鐘之類的簡單任務。

LLM 非常適合那些精度不太重要的應用,或者在輸出生成後需要人工檢查的應用。對於精度要求很高的任務來說,它們就不是一個好的選擇。

自動駕駛系統需要非常高的精度,擁有足夠數據和算力的端到端神經網絡,是否一定能實現這一目標?目前看其因果關係並不明顯。

商業教授伊森·莫里克(Ethan Mollick)寫過關於“鋸齒狀邊界”的文章:複雜的人工智能系統通常在某些任務上表現出色,但在其他任務上卻表現得令人驚訝。特斯拉可能非常擅長在高速公路、十字路口和交通環島行駛,但在避開溼水泥或理解警察手勢方面進展甚微。

Waymo的遠程干預問題

Waymo解決問題的方法,是建立一個基本自動化的系統,該系統能夠在需要時依靠人工協助。

雖然從安全角度來看這非常有效,但我開始懷疑它的經濟性。如果 Waymo 車輛持續需要它遠程指導,可能需要僱傭很多遠程操作員,從而抵消了去掉駕駛員所節省的成本。

上個月, 亞馬遜宣佈 將從 Amazon Fresh 雜貨店中移除其名爲“Just Walk Out”的無需結賬技術。

與Waymo一樣,亞馬遜在2018年也對其技術非常看好。當年彭博社報道稱,亞馬遜計劃開設3000家 基於Just Walk Out技術的Amazon Go便利店。

但這從未發生過,The Information 的報道有助於解釋原因——亞馬遜的技術並不是完全自動化的:該公司在印度有1,000 多名員工手動驗證客戶的選擇。到 2022 年中期,“Just Walk Out 每 1,000 筆銷售需要大約 700 條人工評價。”

亞馬遜的目標是將這一數字減少到每 1,000 件商品有20-50條人工評價,但這一目標也並未實現。

Waymo也會有類似的問題嗎?我不知道,但它確實拒絕就遠程干預的頻率發表評論。

但我猜測,這對 Waymo 來說不會是一個嚴重的問題。在我3月份的試駕過程中,Waymo 的車輛行駛平穩、自信。假設車輛需要不斷尋求遠程指導,我預計它的表現會更加猶豫不決、不穩定。

最後,Waymo 的擴張似乎也相當迅速。本月早些時候,該公司宣佈 每週服務 50,000 趟行程,而九個月前爲每週10,000 趟行程。除非管理層確信他們有一條明確的盈利之路,否則 Waymo 似乎不太可能發展得那麼快。

無論如何,我認爲特斯拉還沒有找到更好的方法來解決這個問題。大型、複雜的神經網絡往往擅長某些事情,但也有不擅長的事情。控制兩噸重車輛的人工智能系統,需要始終非常可靠。至少在接下來的幾年裡,或許這隻有通過人力支持才能實現。