利用端到端+VLM,理想汽車重塑智駕體驗
理想汽車智能駕駛正式進入AI大模型時代,爲消費者帶來前所未有的智駕新體驗。
9月14日的晚高峰來臨前,有車主收到了理想汽車全新一代智能駕駛端到端+VLM技術的推送,萬人體驗活動就此開啓,涵蓋了MEGA、L9、L8、L7和L6的AD Max車型。而早在兩個多月前,理想汽車就已經啓動了相關的早鳥計劃,測試工作也在緊鑼密鼓地進行中。
這一系列動作不僅極大地推動了理想汽車在智能駕駛領域的發展,也激發了車主們對更高水平智能駕駛技術的新期待。
現在,滿載着廣大用戶的殷切期望,理想汽車全新一代雙系統智能駕駛解決方案「端到端+VLM」於10月23日正式全量推送,揭開了全新智駕系統的神秘面紗。這標誌着理想汽車智能駕駛正式進入 AI 大模型時代,實現像人一樣思考,像人一樣駕駛,場景全覆蓋、行駛更舒適、通行更高效。
毫無疑問,智能化將是新能源汽車未來發展的方向之一,而智能駕駛作爲智能化的核心部分,也是最具科技競爭力的一環,自然而然成爲了各大車企競相角逐的關鍵領域。如果某款主流車型的產品亮點裡沒有提及智能駕駛技術,似乎意味着該品牌在技術上已經落後於時代。
隨着ADS 3(參數丨圖片).0、端到端解決方案以及AI大模型等先進技術的不斷涌現,智能駕駛正被賦予更多價值和更深層次的意義。這些新技術不僅顯著提升了車輛的實際性能,使日常駕駛更加安全可靠,也成爲提升品牌形象的有效手段,充分展示了科技型汽車企業在技術研發方面的創新能力。因此,理想汽車此次進行的端到端+VLM全量推送引起了廣泛的關注和討論,成爲了業界和消費者熱議的焦點。
有些人可能會很好奇,理想汽車的端到端+VLM究竟是什麼“黑科技”?
理想端到端+VLM是新一代的智能駕駛解決方案,是真正意義上One-Model結構的端到端,並且率先將視覺語言模型VLM部署到車端芯片上的雙系統方案。它不僅是世界首創,更是實現了全量用戶的推送,這在智能駕駛領域可謂是“big news”。
兩個系統,強於一個系統。這既可以是簡單的1+1>2算式,也可以是深邃的思考結論。
簡單說明一下端到端技術,是指不再用人工制定規則的方式去約束智能駕駛系統,僅僅用人工智能模型,機械自學習的方式,去替代智能駕駛過程中的感知、規劃控制等模塊,從視覺的“輸入”端,到智能駕駛系統最後控制車輛自行駛“輸出”端,完全依靠模型自身系統來處理,讓功能完全黑盒化。
端到端模型,追求One-Model一體化端到端。不過出於安全冗餘的考量,目前市場上在智駕領域處於領軍者的車企,都會設置一定的底層負責安全冗餘的算法,將感知、規劃控制模塊獨立,而接口仍然由人工定義和連接。而理想引入了另一個系統——系統2,VLM視覺語言模型,真正實現了One-Model結構的端到端。
對此,理想汽車智能駕駛研發副總裁郎鹹朋博士這樣解析運作機理:系統1完全靠自己的視覺感知,執行操作,系統2需要長期積累知識給系統1提醒和告知。系統2能夠提供複雜環境的理解能力、讀懂導航地圖的能力以及交通規則的理解能力,輔助系統1進行規劃決策。
按照理想的說法,VLM具備應對複雜場景的邏輯思考及決策能力。理想汽車模仿人類大腦雙系統架構,讓兩個系統爲整個理想的智能駕駛服務。
基於這些優勢,全新的智能駕駛解決方案,可以實現實現路邊起步、環島、U 型掉頭等困難場景的順暢通行,同時基於獨有的VLM視覺語言模型,實現了限時公交車道、潮汐/可變車道、減速帶、坑窪路面等場景識別和應對能力。與此同時,在安全性、舒適性和效率上大幅提升,擬人化程度再上新的臺階。
不僅如此,在智能駕駛的車機交互界面也進行了全面煥新,雙系統的“所見所想”可以實時展現,讓智駕的全過程更易於用戶理解,也更讓用戶安心。並且,新增了智駕行程卡自動上傳手機的功能,可以實現隨時隨地的分享,而車輛中心也新增了智駕統計自定義查看,也可以生成分享頁。
值得一提的是,此次全量用戶推送的版本基於V4.8.6模型而來,是在400萬clips基礎上迭代的第16個版本,增加了城市夜景的數據配比。主要在三個方面做了優化:第一,提升了超車場景的理解能力,讓變道更積極;第二,提升了導航信息的理解能力,讓導航變道的時機更合理;第三,提升了障礙物檢測精度,讓繞行幅度更合理。
從“無圖NOA系統”,再到“端到端+VLM”,一開始在智駕領域似乎處於落後局面的理想汽車,顯然已經縮小了和其他車企的差距並着眼反超。事實上,理想汽車在研發無圖NOA時,就已經預研端到端架構,提前做好了儲備。
“所以這是我們爲什麼會速度比較快的原因。如果大家覺得犧牲了效率,其實是因爲沒有找到提效的方法。” 理想汽車智能駕駛高級算法專家詹錕曾在採訪中表示:“我們逐漸已經找到了通過自動化測試、世界模型高效驗證模型的方法,所以我們才能兼顧速度和質量。”
那麼,和此前的無圖NOA系統相比,端到端+VLM視覺語言模型究竟有什麼技術優勢?
文章轉載:[lml.xjc24b.com)
首先,端到端不依賴規則式邏輯,具備更擬人化的駕駛方式,擁有老司機般的絲滑體驗。以路邊起步爲例,目前一些車型已經實現了路邊起步,但只能在D擋或Autohold狀態下可以激活,而理想汽車的端到端模型在P擋就能激活,實現了“上車就能開”,並且依靠更強的freespace規劃,不再強依賴車道關係。
文章轉載:[hwd.smreti.com)
其次,整體大幅提升了安全、舒適和效率,能力更強、上限更高。例如U型掉頭和環島通行等這些複雜路況,端到端具備更強的側向感知能力和複雜道路結構的理解能力,讓車輛的行駛軌跡更擬人化,決策也更果斷。而在擁堵路況時,變道能力更強,能夠即時準確的執行繞行決策,整體反應更像“老司機”。
文章轉載:[dg.abetonline.com)
更重要的是,VLM視覺語言模型具備理解物理世界複雜的交通環境和中文語義的能力,可以輔助端到端解決安全、導航、法規和舒適等方面的自動駕駛業內難題。例如限時公交車道、潮汐車道、可變車道等,曾經無法解決的問題,通過VLM都可以進行準確識別,並正確選擇車道通行,在遵守交規的同時大大提升通行效率。
文章轉載:[zqf.mingtiangenghao.com)
而對於其他像丁字路口、減速帶、坑窪路面、夜間無燈路段、學校路段、施工路段等複雜交通環境都能進行準確判斷,以語言和UI交互兩個方式進行提前告警並及時進行減速,這些都是行業獨有、業內首創。
文章轉載:[va.fivethreedialtone.com)
此次端到端+VLM的更新,還對高速NOA進行了優化,針對前方慢車可以更早識別,並果斷髮起超車動作,讓車輛的行駛更高效更安全。而這套全新一代的智能駕駛解決方案,迭代速度更快,還具備全數據驅動、快速迭代的能力。
文章轉載:[rkh.muchuankj.com)
一路走來,理想汽車經歷了顯著的成長與進步,從智能駕駛領域的後來者,發展成爲行業先鋒。如今,它已成爲首個將視覺語言模型(VLM)部署到Orin-X芯片的企業,並率先採用了雙系統架構。憑藉百萬輛的規模化運營效率,預計至2024年底,其智能駕駛累積里程將達到30億公里之巨,訓練算力超過8 EFLOPS。這些成就標誌着理想汽車正穩步邁向智能駕駛技術前沿,並持續在這一領域實現新的突破,讓用戶享受到新技術帶來的便捷與安全。利用端到端+VLM,理想汽車重塑智駕體驗
文章轉載:[nuz.0852it.com)
文/鄧勇拓
文章轉載:[je.nbqsj.com)
導語:理想汽車智能駕駛正式進入AI大模型時代,爲消費者帶來前所未有的智駕新體驗。
文章轉載:[fo.pole-star2013.com)
在9月14日的晚高峰來臨前,有車主收到了理想汽車全新一代智能駕駛端到端+VLM技術的推送,萬人體驗活動就此開啓,涵蓋了MEGA、L9、L8、L7和L6的AD Max車型。而早在兩個多月前,理想汽車就已經啓動了相關的早鳥計劃,測試工作也在緊鑼密鼓地進行中。
文章轉載:[by.ft-tax.net)
隨着ADS 3.0、端到端解決方案以及AI大模型等先進技術的不斷涌現,智能駕駛正被賦予更多價值和更深層次的意義。這些新技術不僅顯著提升了車輛的實際性能,使日常駕駛更加安全可靠,也成爲提升品牌形象的有效手段,充分展示了科技型汽車企業在技術研發方面的創新能力。因此,理想汽車此次進行的端到端+VLM全量推送引起了廣泛的關注和討論,成爲了業界和消費者熱議的焦點。
文章轉載:[xi.oxycapsule.com)
一路走來,理想汽車經歷了顯著的成長與進步,從智能駕駛領域的後來者,發展成爲行業先鋒。如今,它已成爲首個將視覺語言模型(VLM)部署到Orin-X芯片的企業,並率先採用了雙系統架構。憑藉百萬輛的規模化運營效率,預計至2024年底,其智能駕駛累積里程將達到30億公里之巨,訓練算力超過8 EFLOPS。這些成就標誌着理想汽車正穩步邁向智能駕駛技術前沿,並持續在這一領域實現新的突破,讓用戶享受到新技術帶來的便捷與安全。
文章轉載:[ts.wdlpd.com)