☰

利用端到端+VLM，理想汽車重塑智駕體驗

理想汽車智能駕駛正式進入AI大模型時代，爲消費者帶來前所未有的智駕新體驗。

9月14日的晚高峰來臨前，有車主收到了理想汽車全新一代智能駕駛端到端+VLM技術的推送，萬人體驗活動就此開啓，涵蓋了MEGA、L9、L8、L7和L6的AD Max車型。而早在兩個多月前，理想汽車就已經啓動了相關的早鳥計劃，測試工作也在緊鑼密鼓地進行中。

這一系列動作不僅極大地推動了理想汽車在智能駕駛領域的發展，也激發了車主們對更高水平智能駕駛技術的新期待。

現在，滿載着廣大用戶的殷切期望，理想汽車全新一代雙系統智能駕駛解決方案「端到端+VLM」於10月23日正式全量推送，揭開了全新智駕系統的神秘面紗。這標誌着理想汽車智能駕駛正式進入 AI 大模型時代，實現像人一樣思考，像人一樣駕駛，場景全覆蓋、行駛更舒適、通行更高效。

毫無疑問，智能化將是新能源汽車未來發展的方向之一，而智能駕駛作爲智能化的核心部分，也是最具科技競爭力的一環，自然而然成爲了各大車企競相角逐的關鍵領域。如果某款主流車型的產品亮點裡沒有提及智能駕駛技術，似乎意味着該品牌在技術上已經落後於時代。

隨着ADS 3（參數丨圖片）.0、端到端解決方案以及AI大模型等先進技術的不斷涌現，智能駕駛正被賦予更多價值和更深層次的意義。這些新技術不僅顯著提升了車輛的實際性能，使日常駕駛更加安全可靠，也成爲提升品牌形象的有效手段，充分展示了科技型汽車企業在技術研發方面的創新能力。因此，理想汽車此次進行的端到端+VLM全量推送引起了廣泛的關注和討論，成爲了業界和消費者熱議的焦點。

有些人可能會很好奇，理想汽車的端到端+VLM究竟是什麼“黑科技”？

理想端到端+VLM是新一代的智能駕駛解決方案，是真正意義上One-Model結構的端到端，並且率先將視覺語言模型VLM部署到車端芯片上的雙系統方案。它不僅是世界首創，更是實現了全量用戶的推送，這在智能駕駛領域可謂是“big news”。

兩個系統，強於一個系統。這既可以是簡單的1+1＞2算式，也可以是深邃的思考結論。

簡單說明一下端到端技術，是指不再用人工制定規則的方式去約束智能駕駛系統，僅僅用人工智能模型，機械自學習的方式，去替代智能駕駛過程中的感知、規劃控制等模塊，從視覺的“輸入”端，到智能駕駛系統最後控制車輛自行駛“輸出”端，完全依靠模型自身系統來處理，讓功能完全黑盒化。

端到端模型，追求One-Model一體化端到端。不過出於安全冗餘的考量，目前市場上在智駕領域處於領軍者的車企，都會設置一定的底層負責安全冗餘的算法，將感知、規劃控制模塊獨立，而接口仍然由人工定義和連接。而理想引入了另一個系統——系統2，VLM視覺語言模型，真正實現了One-Model結構的端到端。

對此，理想汽車智能駕駛研發副總裁郎鹹朋博士這樣解析運作機理：系統1完全靠自己的視覺感知，執行操作，系統2需要長期積累知識給系統1提醒和告知。系統2能夠提供複雜環境的理解能力、讀懂導航地圖的能力以及交通規則的理解能力，輔助系統1進行規劃決策。

按照理想的說法，VLM具備應對複雜場景的邏輯思考及決策能力。理想汽車模仿人類大腦雙系統架構，讓兩個系統爲整個理想的智能駕駛服務。

基於這些優勢，全新的智能駕駛解決方案，可以實現實現路邊起步、環島、U 型掉頭等困難場景的順暢通行，同時基於獨有的VLM視覺語言模型，實現了限時公交車道、潮汐/可變車道、減速帶、坑窪路面等場景識別和應對能力。與此同時，在安全性、舒適性和效率上大幅提升，擬人化程度再上新的臺階。

不僅如此，在智能駕駛的車機交互界面也進行了全面煥新，雙系統的“所見所想”可以實時展現，讓智駕的全過程更易於用戶理解，也更讓用戶安心。並且，新增了智駕行程卡自動上傳手機的功能，可以實現隨時隨地的分享，而車輛中心也新增了智駕統計自定義查看，也可以生成分享頁。

值得一提的是，此次全量用戶推送的版本基於V4.8.6模型而來，是在400萬clips基礎上迭代的第16個版本，增加了城市夜景的數據配比。主要在三個方面做了優化：第一，提升了超車場景的理解能力，讓變道更積極；第二，提升了導航信息的理解能力，讓導航變道的時機更合理；第三，提升了障礙物檢測精度，讓繞行幅度更合理。

從“無圖NOA系統”，再到“端到端+VLM”，一開始在智駕領域似乎處於落後局面的理想汽車，顯然已經縮小了和其他車企的差距並着眼反超。事實上，理想汽車在研發無圖NOA時，就已經預研端到端架構，提前做好了儲備。

“所以這是我們爲什麼會速度比較快的原因。如果大家覺得犧牲了效率，其實是因爲沒有找到提效的方法。” 理想汽車智能駕駛高級算法專家詹錕曾在採訪中表示：“我們逐漸已經找到了通過自動化測試、世界模型高效驗證模型的方法，所以我們才能兼顧速度和質量。”

那麼，和此前的無圖NOA系統相比，端到端+VLM視覺語言模型究竟有什麼技術優勢？

文章轉載:[lml.xjc24b.com）

首先，端到端不依賴規則式邏輯，具備更擬人化的駕駛方式，擁有老司機般的絲滑體驗。以路邊起步爲例，目前一些車型已經實現了路邊起步，但只能在D擋或Autohold狀態下可以激活，而理想汽車的端到端模型在P擋就能激活，實現了“上車就能開”，並且依靠更強的freespace規劃，不再強依賴車道關係。

文章轉載:[hwd.smreti.com）

其次，整體大幅提升了安全、舒適和效率，能力更強、上限更高。例如U型掉頭和環島通行等這些複雜路況，端到端具備更強的側向感知能力和複雜道路結構的理解能力，讓車輛的行駛軌跡更擬人化，決策也更果斷。而在擁堵路況時，變道能力更強，能夠即時準確的執行繞行決策，整體反應更像“老司機”。

文章轉載:[dg.abetonline.com）

更重要的是，VLM視覺語言模型具備理解物理世界複雜的交通環境和中文語義的能力，可以輔助端到端解決安全、導航、法規和舒適等方面的自動駕駛業內難題。例如限時公交車道、潮汐車道、可變車道等，曾經無法解決的問題，通過VLM都可以進行準確識別，並正確選擇車道通行，在遵守交規的同時大大提升通行效率。

文章轉載:[zqf.mingtiangenghao.com）

而對於其他像丁字路口、減速帶、坑窪路面、夜間無燈路段、學校路段、施工路段等複雜交通環境都能進行準確判斷，以語言和UI交互兩個方式進行提前告警並及時進行減速，這些都是行業獨有、業內首創。

文章轉載:[va.fivethreedialtone.com）

此次端到端+VLM的更新，還對高速NOA進行了優化，針對前方慢車可以更早識別，並果斷髮起超車動作，讓車輛的行駛更高效更安全。而這套全新一代的智能駕駛解決方案，迭代速度更快，還具備全數據驅動、快速迭代的能力。

文章轉載:[rkh.muchuankj.com）

一路走來，理想汽車經歷了顯著的成長與進步，從智能駕駛領域的後來者，發展成爲行業先鋒。如今，它已成爲首個將視覺語言模型（VLM）部署到Orin-X芯片的企業，並率先採用了雙系統架構。憑藉百萬輛的規模化運營效率，預計至2024年底，其智能駕駛累積里程將達到30億公里之巨，訓練算力超過8 EFLOPS。這些成就標誌着理想汽車正穩步邁向智能駕駛技術前沿，並持續在這一領域實現新的突破，讓用戶享受到新技術帶來的便捷與安全。利用端到端+VLM，理想汽車重塑智駕體驗

文章轉載:[nuz.0852it.com）

文/鄧勇拓

文章轉載:[je.nbqsj.com）

導語：理想汽車智能駕駛正式進入AI大模型時代，爲消費者帶來前所未有的智駕新體驗。

文章轉載:[fo.pole-star2013.com）

在9月14日的晚高峰來臨前，有車主收到了理想汽車全新一代智能駕駛端到端+VLM技術的推送，萬人體驗活動就此開啓，涵蓋了MEGA、L9、L8、L7和L6的AD Max車型。而早在兩個多月前，理想汽車就已經啓動了相關的早鳥計劃，測試工作也在緊鑼密鼓地進行中。

文章轉載:[by.ft-tax.net）

隨着ADS 3.0、端到端解決方案以及AI大模型等先進技術的不斷涌現，智能駕駛正被賦予更多價值和更深層次的意義。這些新技術不僅顯著提升了車輛的實際性能，使日常駕駛更加安全可靠，也成爲提升品牌形象的有效手段，充分展示了科技型汽車企業在技術研發方面的創新能力。因此，理想汽車此次進行的端到端+VLM全量推送引起了廣泛的關注和討論，成爲了業界和消費者熱議的焦點。

文章轉載:[xi.oxycapsule.com）

文章轉載:[ts.wdlpd.com）

利用端到端+VLM，理想汽車重塑智駕體驗

相關資訊