大模型迭代加速終端演進,有什麼新挑戰?
21世紀經濟報道記者駱軼琪 深圳報道
雖然對於不少硬件來說,AI技術早在多年前已滲透到日常功能中,但真正有望帶來顛覆性改變還是AI大模型的到來和落地應用。
近日舉行的阿里雲深圳AI峰會上,阿里雲智能集團副總裁、公共雲首席解決方案架構師韓鴻源在演講中回顧分析,雲計算的發展伴隨新技術爆炸和新業務爆發而持續迭代,發展至今大概經歷了六個階段,人工智能泛在存在正成爲新趨勢。
這也意味着更多類型終端產品和應用將持續演進和迭代,應對模型落地挑戰。
北科瑞聲創始人、國家重大人才計劃特聘專家劉軼指出,電腦、手機、手錶等終端是離用戶最近的信息入口,大模型與終端的結合將加快AI技術普及。
“在大模型時代,第五代人機交互模式將取代第四代,也就是蘋果率先推出的觸控模式。後續將跟人之間交流一樣,用自然語言交互讓機器明白人的意圖。那麼就可能在設備端出現私有化的個人助理,甚至可以落地在汽車、平板甚至手錶、手環上。”他續稱,產業界也應協作推動大模型應用落地。
持續迭代
按照發展階段來看,韓鴻源指出,最開始,雲計算承載的是把線下的IT技術能力搬到雲上,目的是降低成本和方便管理能力提升,到今天爲止很多人對雲計算的認識依然停留在這一階段。
實際上經過初期管理能力和成本優化階段後,雲上誕生了雲原生這類新的開發範式,由此加速了應用和能力的迭代提升,也促進雲計算本身發展。
雲原生技術普及後,下一個階段誕生了很多先進架構需求,這來自於越來越多關鍵業務被承載在雲上後,提出了新需求。例如通過軟件定義的方式,做到高可靠性和高可用性。
此後便迎來全球化蓬勃發展,近些年來全球化過程中的雲計算,面臨如合規、數據主權等話題,此後通過很多工作解決掉了絕大部分擔心。由此也促成國內企業蓬勃地出海發展。
近兩年來,隨着生成式AI爆發,對基礎設施和基礎能力提出新需求。“預計隨着AI持續發展和成本持續降低,AI會無處不在,就進入了人工智能泛在的新發展階段,我們在鋪平需要的所有技術能力和手段準備。”他表示。
韓鴻源指出,生成式AI正對計算、數據、開發、部署等多個維度的技術能力提出新挑戰。例如計算能力從PFLOPS至EFLOPS計算量需求,且要持續運行一個訓練任務從數天至數月;數據量則是TB級至PB級的體量會常態化參與到計算過程中,才能產生想要的結果等。整體看,目前已有70%的組織在使用雲上託管的AI服務。
目前看到的新發展方向是模型即服務(MaaS)。他進一步分析道,傳統意義上會認爲雲計算是由基礎設施和軟件層技術來幫助實現。但隨着人工智能發展,今天需要把另一個因素引進到技術棧中,就是“模型即服務”能力。此前IaaS、PaaS是更偏傳統計算機架構下有效執行的能力,但到今天以模型和AI爲中心時,神經網絡會成爲計算能力一個基礎的組成部分,經網絡計算方式會跟以前傳統機器學習的方式有很大差異,結合新方式引入會帶來很多變化,如資源池、管理方式、技術能力等。由此,未來將是IaaS+PaaS+MaaS三個方向共同結合支撐業務系統和應用有效地運行和發展。
基於這些思考和觀察,通義模型系列也在持續迭代和完善生態。通義系列模型正式發佈始於2022年9月;2023年10月通義系列應用發佈,同時通義千問2.0發佈,彼時已經具備主流先進模型能力;此外也在着手開源貢獻,2024年4月,通義千億級模型開源;期間也在構建開放社區推動商業化應用。
落地挑戰
當然大模型的出現並持續迭代,也爲端側落地帶來新的變量和挑戰。
優必選科技副總裁、研究院副院長龐建新分享道,大模型的出現,對端側的多模感知、任務決策和規劃等提出新挑戰。例如多模態感知方面,將不止包括語音和環境感知,還需要結合知識和上下文;在場景落地方面,此前手動輸入了諸多條件,但隨着環境優化,大模型的能力落地需要一定程度重新規劃和執行。
OPPO AI技術戰略規劃總監陳曉春則表示,雖然AI技術已經存在了很長時間,但真正能感受到體驗切實改變還是從生成式AI開始。對此,OPPO的思考是,一開始探索全域個人助理,此後是落地到本地完成一定工作;再是本地APP如何與手機結合,解決用戶在手機端時間碎片化的問題。
對於手機端研發來說面臨的挑戰包括:一方面是時延,例如在海外手機漫遊場景下如何完成端側的實時翻譯能力;其二是高隱私,端側的意圖推理具備一定隱私屬性,那麼在端雲協同之間如何完善安全保障措施;其三是如何平衡功耗和成本,“模型在端側運行不需要那麼大,那麼遇到多種感知和大模型結合的情況下,很多小尺寸甚至傳統方案就要引用剛進來。”
劉軼分析道,AI在語音方面的發展對市場進行過兩次較爲重要的教育。第一次是Siri推出,在手錶、手機上具備語音交互能力,但當時受限於算法和算力條件,並未達到多數用戶的期望效果;第二次就是近期,GPT-4o的展示顯示出其已經可以像人一樣具備低延遲、快速理解能力。
但國內能夠把語音相關交互落地成產品,真正離線落地的終端很少,這是伴隨了諸多挑戰和壁壘。“比如我認爲7B規模的端側模式是極限,但可能會因爲用戶體驗問題,影響到落地在手機和平板上的產品完善;1B規模很多人在研究,但可能是面向特定行業和領域。那麼最終就要與傳統的處理方法,例如知識圖譜、增強搜索能力關聯。再真正達到可用的現實效果。”
諸多頭部終端廠商都在大模型領域與阿里雲深度合作,以期探索並提升產品智能化體驗。
龐建新指出,優必選通過與阿里雲開展大模型相關合作,希望解決如何用開源大模型,根據場景做調參技術優化、端側部署和雲端部署協同等問題。“我們相信,端雲結合是短期必須落實的問題,這對知識和內容有很大依賴度,中間如何調度需要廠商自己解決,根據形態和場景任務來推進。”
OPPO也一直與通義系列模型在展開合作。“在多模態大模型加持下,人機交互側將出現很大變革。更多服務和知識節點需要依賴雲側模型,那麼就要跑在距離用戶很近、算力較大的地方。算子、模型技術本身等方面,我們的研發項目都在緊密開展合作。”陳曉春分析道。
此外,vivo基於阿里雲訓練自研藍心大模型,千卡大模型預訓練性能接近LLaMA水平。目前,vivo藍心大模型已對vivo手機的AI影像、智能助理、圖文創作等場景進行了全面優化,並升級了視覺輔助產品“vivo看見”。
小鵬汽車也宣佈,已在智能座艙場景中新增接入阿里雲通義千問。在發佈量產上車的端到端大模型後,小鵬成爲同時將大模型落地座艙和智駕的車企。
對於產業界如何協作推動大模型應用落地,劉軼還指出,一方面要借鑑Open AI的分享和衆籌機制,例如在應用中,阿里雲提供通義系列底座,就需要結合千行百業,共同建設面向行業、好用的大模型;另一方面是如何做好端雲協同,“語音交互在低算力條件下只能做到本地信號處理或壓縮編碼,更多要在雲端處理,如何做好連接很重要,Rabbit R1就是在做一種嘗試。”