雷軍招募“天才AI少女”,小米要做大模型風口下的“飛豬”?
12月20日,有消息稱,DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一——羅福莉將加入小米,或供職於小米AI實驗室,領導小米大模型團隊。
羅福莉畢業於北大計算語言學碩士畢業,曾任職於阿里達摩院機器智能實驗室,主導開發了多語言預訓練模型VECO,並在DeepSeek參與了MoE大模型DeepSeek-V2的研發。
知情人士透露,雷軍對小米在大模型領域的發力時間較晚感到擔憂。此次親自下場重金招募核心人才,甚至開出了千萬元級別的薪酬。
如今,雷軍將“天才AI少女”招入麾下,小米打的是怎樣的算盤?
大模型“激活”手機存量市場
隨着芯片算力的持續提升,AI Agent在智能手機上的應用逐漸成爲常態。通過手機底層系統級AI,AI Agent將在人機交互和意圖識別方面取得顯著進步,能夠更加精準地理解用戶需求,主動完成任務,併成爲用戶高度定製化的私人助理。這一趨勢將成爲品牌維護用戶羣體的核心護城河。
據IDC預測,2025年中國新一代AI手機市場出貨量將達1.18億臺,同比增長59.8%,整體市場佔比達到40.7%。
在這一背景下,小米麪臨巨大機遇與挑戰。根據2024年第三季度財報,小米智能手機業務實現收入人民幣475億元,同比增長13.9%;高端化戰略初顯成效。然而,隨着市場進入存量化階段,高端創新需求的升級讓大模型技術成爲品牌突圍的關鍵。
事實上,AI技術早已融入智能手機的方方面面,從語音助手到影像處理,再到性能優化。但大模型的出現,爲手機AI能力帶來了質的飛躍。
然而,與OPPO和vivo相比,小米在大模型技術的宣傳上顯得較爲低調。雖然在影像處理、語義助手等領域有所佈局,但在多模態交互與跨App聯動等方面的應用仍有提升空間。
輕量化和本地部署
小米集團創始人雷軍曾公開表示:“我們做大模型的思路可能和很多公司不太一樣,我們選擇主力突破的是輕量化和本地部署。”
從成本考慮,雲側的AI大模型要根據調用付費,還需要巨大算力,用起來成本也很高。而端側在本地運算,如果將大部分AI推理場景放在端側,不僅可以更接近用戶的數據,實現更有效的訓練,同時也能夠大量節約雲端算力開支。
從用戶構成考慮,以“互聯網手機”起家的小米,用戶對於互聯網新技術的接受程度更高。用戶對於小愛同學的接受程度也更高,小米旗下人工智能助手小愛同學月活用戶數達到1.35億,同比增長8.5%。
從產品方面考慮,“爲發燒而生”的小米手機,用戶在芯片性能、攝像頭技術、屏幕顯示等方面有着相對更高的需求,這也讓小米更傾向於推出同價位性能更高的手機,這也爲其未來部署本地化AI創造了條件。
此外,根據2024年Q3財報顯示,小米集團的AIoT平臺已連接的IoT設備數超8.61億,同比增長23.2%。被稱爲“雜貨鋪”的小米,這些海量的AIoT設備,輕量化、需要藉助分佈式算力的終端設備,目前主要依賴於雲端的AI能力,想要實現本地化部署,對於輕量化的需求更高。
因此,儘管端側大模型在效果上難以媲美雲端,但其在隱私保護、低延遲和成本控制方面的優勢,使其成爲小米發力的重點領域。
甚至可以說,小米是更適合發力端側大模型的企業,也是更需要發力端側大模型的企業之一。
2024年2月,小米推出了基於大模型的AISP影像處理平臺,用於解決超高倍焦段拍攝中的細節缺失問題,顯著提升圖像質量。同年5月,小米發佈了大語言模型MiLM,覆蓋從0.3B到30B多個參數規模,適配不同場景需求,並通過技術突破實現了端側部署。
爲了確保本地部署模型的效果,小米團隊開發了專用的硬件加速模塊,使得MiLM模型的運行速度提升了約35%,同時功耗降低20%。此外,通過創新的“TransAct大模型結構化剪枝方法”和端側量化技術,小米團隊大幅提升了訓練效率並降低了量化精度損失。MiLM2-4B模型已在端側成功部署,爲未來更多設備的本地化部署打下基礎。
重金招攬AI人才:雷軍的破局之道
小米爲何選擇招募羅福莉?
在大模型之家看來,這不僅是看中她的研究能力,更是認準其研究方向與小米大模型戰略的契合度。羅福莉曾在阿里主導開發的VECO模型是跨語言理解與生成的典範,其在文本生成與風格轉換領域的研究爲智能終端設備提供了核心技術支撐。其所研究的方向,都是目前最熱門的語音和文本識別技術,而文本的識別改寫、語義的轉化,正是目前手機、平板、PC等移動終端、以及車機設備中,最爲常用的場景。因此,羅福莉與小米的發展重點可謂是既專業又對口。
細數小米的發展過程,每年都有一個百萬美金年度技術大獎,這是小米內部規格最高的獎項,獎勵在重大技術創新項目中做出關鍵突破的10人以內團隊。而這哥獎項的評選,主要遵循三個標準:技術的獨創性、世界範圍內的領先性,以及與小米主營業務的契合性。
羅福莉的加入,延續了小米招募頂尖人才的傳統。無論是爲了吸引盧偉冰、王川等行業大咖,小米多次通過收購對方創業公司實現人才引入。在技術競爭日益激烈的時代,人才是成事的關鍵。
小米近年來在全球範圍內廣泛吸納AI頂尖人才。從美國硅谷到中國北京,從算法工程師到AI產品專家,小米的人才佈局正在形成覆蓋全球的AI研發網絡。這不僅提升了小米的技術實力,也使其具備了在多個領域同時展開創新的能力。小米AI實驗室的研究項目數量在過去一年增長了45%,其中多模態交互、圖像生成和語義理解成爲重點方向。
羅福莉的到來,或將加速小米在這些前沿領域的技術落地,進一步縮小與行業領先者的差距。
雷軍曾表示,小米將繼續加大在AI、物聯網(IoT)等前沿技術的投入,力爭在全球科技創新中佔據一席之地。爲了吸引頂尖人才,小米不僅提供高薪酬,還打造了開放的研發環境和多樣化的技術交流平臺。此外,小米還計劃與高校和研究機構建立更緊密的合作關係,共同推動AI技術的基礎研究和應用落地。這種雙向合作模式,將爲小米注入源源不斷的技術創新動力。
大模型駛向智駕風口
與其他手機企業不同,小米的另一優勢便是擁有汽車業務,雷軍在2024年度演講中提出,通過AI賦能“人車家”生態,推動技術與場景的深度融合。
小米的「人車家全生態」,其中汽車領域的大模型實踐,既是體驗賦能、也是落地樣板。這意味着在小米SU7上,用戶不僅能用小愛同學深度控車,還能進行手機、移動設備,甚至是與IoT設備的全方位控制能力。
如今,智駕已經成爲新能源汽車領域的必爭之地。理想汽車創始人李想曾表示,“大模型的研發和訓練是智能電動車企業的必要能力。” 小米的智能駕駛系統通過接入多模態大模型技術,賦能從語音交互到複雜道路環境識別的全鏈路場景。
除了基於LLM帶來的理解能力的升級,在自動駕駛方面,小米汽車智能駕駛系統在半年內經歷了三次重大升級,從高精地圖+模塊化架構到無圖+模塊化架構,再到如今的端到端大模型架構,追趕了友商三代研發步伐。目前,小米端到端全場景智能駕駛系統面對車位啓動、路口通行、無保護左右轉、閘機通行、超車、借道避讓、自動進入車庫、自動泊車等場景時的表現都比較流暢,展現出了“類人”的駕駛能力。
12月23日,小米SU7宣佈1.4.5 OTA推送,正式接入視覺語言大模型(VLM),可識別複雜道路環境和特殊交通規則,並通過語音和文字給予實時提示。同時,充電地圖完成升級,與蔚來、小鵬、理想達成充電補能網絡合作。這些升級不僅提升了用戶體驗,也展示了小米在大模型技術實際落地中的實力。
除了智能手機和汽車,小米的大模型技術還深入滲透到AIoT生態中。從家電控制到安防監控,從語音助手到健康管理,大模型技術正賦能每一個AIoT設備。雷軍強調,小米的目標是實現全場景的智能化,讓每一個設備都成爲用戶的智能夥伴。
爲了實現真正的全場景智能化,小米正加快AIoT設備的互聯互通進程。通過統一的AI框架和大模型算法,小米希望實現設備之間的數據共享和協同工作。這種創新將使用戶體驗更加流暢,併爲小米的生態系統創造新的價值。
招募羅福莉等頂尖AI人才,預示了小米在大模型賽道上發力的決心。通過手機、汽車、AIoT生態的全線佈局,小米的目標並非僅限於技術突破,而是要打造“人車家”融合的完整智能生活場景。未來,小米的成功不僅取決於技術實力,更在於能否將AI能力與用戶需求深度結合。
然而大模型賽道競爭者衆多,挑戰同樣嚴峻。小米在技術積累和市場影響力上仍面臨挑戰,如何將“輕量化”和“本地部署”戰略真正轉化爲用戶可感知的體驗差異,並在多樣化場景中形成閉環生態,是小米必須回答的問題。
站在大模型風口上的小米,能否飛得更高、更遠?答案或許正藏在AI賦能的每一個智能終端中。小米與大模型的故事,纔剛剛開始。