呂本富:端側模型,AI創新的新賽道
本文轉自:環球時報
隨着人工智能(AI)技術的快速發展,大模型的競爭正在從技術驅動過渡到市場驅動。在這一背景下,2024年以來,全球主流大模型間的比拼有兩個要點。一是重要產品發佈,OpenAI等企業的重大發布吸引全球目光;二是關注大規模產業應用和成本控制。
成本是商業考量的第一要義,OpenAI目前已經4次降價,國內頭部互聯網企業的主力模型也不得不大幅降價或將全面免費。數字經濟的發展經歷表明,平臺型通用技術一旦形成,市場會快速進入“馬太效應”,形成一家獨大或幾家壟斷的局面。當然AI+對人類社會的塑造,絕不僅僅生成式大語言模型這一個賽道。
5月22日,在歐洲最大的科技盛會“歐洲科技創新展覽會”(Viva Technology)上,來自中國的百度和榮耀分別闡述了大模型的新賽道——“超級應用和端側模型”,引起了大會的關注。其中,榮耀CEO趙明認爲,基於手機端的AI模型能承載生活娛樂、工作、學習等多個場景,具備在知識問答、文字擴寫、表格生成、編寫代碼、圖像處理,實現圖像填充、實時語音翻譯、智能助手、面部識別解鎖等多項功能。手機使用頻率最高,使用時間最長,因此在AI的落地競賽中,將處於最有利的位置。
大模型的參數規模正在快速增長,約每18個月時間會增長40倍。現在生成式大模型的計算和推理都在雲端進行,大模型參數和使用量的成倍增長帶來巨大計算推理壓力, 當數十億用戶都日常使用生成式AI時,雲端模式顯然難以支持生成式AI的規模化擴展。過大參數也造成了在開發及使用過程中的成本高企,在一定程度上限制了AI應用的拓展和變現。因此,需要針對應用場景的小參數模型。
相比之下,端側模型通常不需要依賴雲端服務器的計算資源,可以減少雲端計算的成本,並且在沒有網絡連接的情況下也能工作。隨着生成式AI模型使用量和複雜性的不斷增長,僅在雲端進行推理並不經濟。將一些處理從雲端轉移到邊緣終端,可減輕雲基礎設施的壓力並減少推理服務成本。推動一部分算力下沉到端側,尤其是與用戶規模龐大的移動端設備結合,正是端側模型的努力方向。據統計,我國存量手機算力是數據中心算力的12倍,但算力利用率不足15%;全國寬帶用戶規模達5.9億,卻有80%帶寬資源處於閒置狀態。發展端側AI將極大地體現AI應用的中國特色。
除了成本以外,發展端側模型還有兩個因素。一是當前企業或個人用戶的AI應用場景都在端側,聊天記錄、辦公記錄、視頻和照片等數據也在端側。只有使用端側模型,才能打消用戶使用AI的疑慮。二是很多工業場景和野外場景,與雲端鏈接網絡不穩定,甚至存在斷線的情況,AI模型可靠性和穩定性就難以保障,必須有獨立運行能力的端側模型才能保障。
一旦大模型的競爭進入到端側領域就面臨幾個需要:完成底層芯片到上層操作系統及應用開發的軟硬一體深度適配;能夠在較低的功耗下運行且適合電池供電的移動設備;有電子圍欄技術感知周圍的場景。端側模型也需要鏈接智能音箱、安全監控、自動化家居控制系統等,提供更個性化和安全的服務。
對於很多中國企業來說,上述競爭就相當於進入主場。部分手機廠商,電池的超長待機、電子圍欄的場景感知的專長技術,從魔法大模型巧妙融入手機硬件,到系統級AI手機操作系統的崛起,具備了對大模型進行量化、剪枝、蒸餾,輕量化、小型化的技術。中國廠商的端側模型通常注重與國內市場的需求和特點相適應,正華麗變身爲世界手機端側AI創新的先鋒。(作者是中國國家創新與發展戰略研究會副會長)