智艙界的黃埔軍校,爲何開啓二次創業?

出品 | 虎嗅科技組

作者 | 丸都山

編輯 | 苗正卿

頭圖 | 《蜂鳥計劃》劇照

在見到戴瑋之前,我並不相信“樂觀主義者”的標籤,會與一個崗位頻繁調動的人有什麼關係。

自2007年加入阿里巴巴,戴瑋先後在淘寶、支付寶、OS事業羣、阿里文娛等部門任職,並於今年4月正式擔任集團旗下的斑馬智行CEO。

作爲新上任的掌門人,留給戴瑋的好消息是,斑馬智行這家公司有着極爲高光的時刻,因爲做出了業內最早的互聯網車機系統,一度被視爲國內智能座艙行業的黃埔軍校;而壞消息是,上一次真正意義上的高光時刻,大概出現在8年前。

“元寶(戴瑋花名)在我們內部,屬於是專打逆風局的角色”,斑馬智行的首席產品官蔡明如此評價道。

但面對如此開局,戴瑋也只是面帶微笑地表示,“其實也還好。”

“至少從行業來看,現在無所謂‘逆風’,過去技術迭代沒那麼快時,留給斑馬的機會確實比較有限,但眼下新技術所孕育的機會太多了,我們一定要把握住。”戴瑋向虎嗅表示。

基於這樣的想法,戴瑋在接到集團任命後,火速集結了一幫“老哥們”,又拉來了一批技術專家,開始了斑馬智行的“二次創業”。

在這一輪生成式AI爆發前,斑馬智行可謂是“起了個大早,趕了個晚集。”

2016年,YunOS for car,即斑馬1.0系統隨上汽榮威RX5車型發佈,駕駛員通過一句“你好,斑馬”的喚醒語,即可通過語音指令完成對車輛的行車導航、娛樂影音、空調車窗等功能的控制。

圖片備註:斑馬1.0系統的語音操作界面

今時今日,這些功能早已屢見不鮮。但在當時,大多數的車廠根本沒有智能座艙的概念,即便是改變世界線的Model 3,此時都沒有進入正式量產階段。

一年後,斑馬系統的累計裝機量達到了40萬,這對於車廠來說已經足夠優秀,但阿里的理想遠不止如此。

2017年9月,阿里在整合原YunOS移動端業務後,正式推出操作系統AliOS——覆蓋汽車、IoT終端、IoT芯片及工業領域,並整合原YunOS移動端業務。在這個龐大的設想中,斑馬系統,或者說是這個系統的智能座艙部分,自然也與OS深度綁定。

但問題是,基於一個如此龐大的“物聯網”操作系統,原本的斑馬系統開始愈發臃腫,儘管OS技術儲備不斷加深,但斑馬智行的產品創新卻“肉眼可見地”慢了下來,直到今年“大模型上車”的計劃正式加速。

在戴瑋、蔡明等人迴歸斑馬後,對公司的業務進行了多次深刻的討論與梳理,並多次在高管中達成一致:All in AI。

首先公司內部明確的一點是,斑馬必須扔掉沉重的包袱。爲了讓業務更加聚焦,未來只做智能座艙——在此之前,斑馬智行秉承着明線發展“智艙”、暗線發展“智駕”的策略。

在蔡明看來,專注於智艙更加符合斑馬智行的實際情況,原因在於目前智駕行業內各家的同質化已經比較嚴重,已經出現價格戰趨勢,而且智駕方案在賣給廠商後,也沒有任何新的商業模式能夠帶來後向收入。

所以斑馬現階段必須要將資源集中在智艙上,因爲智艙與應用的聯動可以產生穩定的後向收入,考慮到斑馬大部分人在阿里系的背景,他們更加了解生態該如何運營、維護,這屬於斑馬得天獨厚的優勢。

另外一點被明確的,就是智艙AI技術與OS的解耦。當然,這並不意味着要與Ali OS割席,而是分化爲兩條商業路徑:

第一種,保持智艙AI技術與AliOS緊耦合,這樣做的好處是數據打通能夠更加順暢,但客戶相對受限。

另外一種就是對智艙及OS進行解耦,僅保留部分中間件,給客戶提供大模型語音及Agent集成的平臺體系,甚至是用對話式的小程序上車,無論客戶的系統是基於安卓,還是Linux,都不影響智艙AI技術的向上框架。

在明確這兩個問題後,戴瑋和團隊成員開始盤點手中所掌握的資源:較爲紮實的OS系統框架、阿里通義大模型的支持、還有自YunOS時代就參與交互設計的團隊,以及新“入夥”的一衆AI研發人員。

戴瑋接手斑馬的一個月後,圍繞“智能座艙AI技術”的開發工作,按下了加速鍵。

作爲YunOS和斑馬1.0“高光時刻”的親歷者,戴瑋和蔡明並不滿足於“讓大模型上車”,他們更關心的是如何做出一款“好用的AI 操作平臺”。

“智能座艙這事在行業裡壓根就沒有做成。”在蔡明看來,通過裝機量、滲透率去評估智艙發展毫無意義,決定生態能夠跑通的只有服務數量及用戶時長兩個指標。

有調研機構曾做過統計,除了地圖導航和音樂等少數APP外,在常見的互聯網服務中,座艙端的年使用率(一年打開一次即作計數)差不多是全端的三分之一到五分之一。

這說明大多數APP在車上,根本無法觸發高頻應用,進而讓車廠與互聯網廠商同時陷入一個尷尬的境地:前者甚至願意爲“應用上車”而付費,這在移動互聯網時代是無法想象的;而後者又不願費時費力地適配應用,去換取車上本就不多的活躍用戶。

因此,在斑馬的產品開發團隊看來,智能座艙AI技術,勢必要去APP化,讓服務和內容直達用戶。

這裡還有一個考量就是,APP有着嚴格規劃的操作層級,如果使用傳統的觸控交互,在行車的過程中操作非常不便,因此在去APP化的同時,儘量使用語音交互,減少非必要的觸控。

以上的技術設想,在產品開發的過程中,逐漸轉變爲兩條基準原則:交互變革與服務重塑,並在此基礎上開發出一款通用型智能座艙AI技術平臺。

儘管斑馬在智艙系統上有着不錯的“底子”,但按照目標讓大模型上車,基本相當於要做一次推到重做。

“就單講語音,整個語音系統由四段組成,分別是前端聲學、ASR(語音識別)、NLU(自然語言理解)、TTS(語音合成),除了第一段外,其他部分都需要用到不同的大模型,有些需要在雲端做泛化,還有些則需要徹底的重構。”蔡明向筆者解釋道。

圖片備註:元神AI的語音演示Demo

而相比於技術問題,更難的其實是工程問題。

“我們之前做測試,可能同樣一款車,僅僅是隔音層薄了一些,用戶甚至根本感知不到,但語音系統就得全換,而我們還需要在不同的路面、不同的車內環境下做各種調優。”

作爲產品和AI的負責人,蔡明爲了協調各部門之間的進度,乾脆把公司所有的P7職級以上的Leader聚在會議室中,用一整天的時間逐一跟進各部門遇到的問題。

四個月後,斑馬智行如期交上了“AI上車”的第一份答卷。

在前不久舉辦的雲棲大會期間,斑馬智行聯合通義發佈了全新智艙技術品牌“元神AI”。

元神AI基於通義大模型,以自然交流爲基礎,圍繞感知場景、組織服務、認知進化構建AI技術體系,旨在解決傳統座艙體驗不佳、服務低頻的問題。當前已基於英偉達Orin X平臺與通義端側多模態大模型做出了POC(產品概念化驗證)。

在發佈會現場,斑馬智行演示了基於元神AI的典型Agent產品——與釘釘聯合打造的“閃記車聽”。

基於自然對話,用戶可以在車內進行線上會議,拓展功能包括前序會議追溯、弱網參會、對話式摘要、自動設置日程與待辦等功能。同時,斑馬智行還對硬件配置做了AI算法優化,如陣列式降噪麥克風、頭枕播報等。

有處細節是,在現場的演示Demo中,Agent產品大多是阿里巴巴集團旗下的應用,比如大麥、高德等,但是第三方應用願意向斑馬開放接口嗎?

對於這個問題,蔡明認爲,目前CP(內容提供商)/SP(服務提供商)在移動端或是桌面端的增量早已見頂,他們需要的是有人能夠建立出新的場景,而智能汽車就是個很好的場景。

“假設放在幾年前,比如之前滴滴、快的爭搶市場的那種狀態,那我們是無法完成應用聚合的。換句話說,當下做智艙的Agent,最大優勢在於各行業也在摸索應用AI化的路徑,我們有機會把用戶常用的應用聚合在多任務列表裡,讓用戶獲得完整的AI體驗。”戴瑋補充道。

值得一提的是,隨着元神AI的發佈,斑馬智行還爲這套系統制定了一個非常有特色的目標,即“100次座艙服務調用不超過1次觸控交互”。

與之對應的是,在元神AI智艙平臺上,幾乎所有的非駕駛操作都通過語音交互完成。

至於這個目標是否符合現在用戶的普遍操作習慣?蔡明舉了一個例子,在iPhone誕生時,大家都覺得它不符合傳統T9鍵盤的輸入方式,但現在不會有人再要求“手機要有打字手感”。

“只要交互體驗做得好,用戶是完全不會介意交互模式改變的。”在蔡明看來,交互變革和服務重塑,實際上就是在推動智能座艙“iPhone時刻”的到來。