騰訊吳運聲:大模型落地進展並不慢,不太關注價格戰|WAIC2024
7月7日消息,在剛閉幕的2024世界人工智能大會(WAIC)上,騰訊公佈了混元大模型(以下簡稱爲“混元”)的最新進展,相關負責人還談到了大模型技術趨勢、價格戰以及應用落地等多個話題。
騰訊集團副總裁蔣傑在會上公開表示,騰訊將人工智能視爲公司長期戰略,目前騰訊圍繞混元組建了一套產品矩陣,包括底層基礎設施、自研大模型、模型開發平臺以及智能體開發平臺。
根據騰訊官方提供的信息,混元大模型在國內率先採用MoE架構,參數量已達到萬億,tokens數量超過7萬億,位居國內大模型第一梯隊。
在本屆WAIC上,推動人工智能技術落地的話題備受關注。大模型行業經過一年多發展,技術層面取得諸多突破,產業重心正在嚮應用落地轉移。
騰訊雲副總裁、優圖實驗室負責人吳運聲在現場採訪中對界面新聞等媒體表示,技術一定要在產業落地併產生價值,這纔是AI發展的方向。
但要讓AI落地,“只靠(優圖)幾百號人肯定不行”,必須降低門檻,吸引產業鏈上的更多企業進入。
在大會上,騰訊還聯合上海交大等研究機構推出了對大模型行業十大趨勢的報告,預測具身智能和人機對齊等方向將成爲未來幾年大模型行業的熱門領域,人工智能也正在成爲人類的“機器外腦”。
不願意看到價格戰,更關注能力提升
雖然外界有很多大模型落地進展緩慢的觀點,但吳運聲並不認同。
“對於大模型好像沒怎麼落地的看法,我覺得並不是這樣”,他認爲最主要的原因是目前大模型的需求實在太多。
比如面臨1萬個大模型的需求場景或者問題,如果其中有100個已經落地,“你覺得這是多還是不多呢?”
今天的大模型技術正在往多模態、零樣本學習、3D和視頻生成等方向快速演進,同時大模型產品的落地門檻也在逐步降低。
爲了推動AI技術落地應用,今年5月騰訊雲一口氣發佈大模型知識引擎、圖像創作引擎和視頻創作引擎三款PaaS工具,將AI能力和RAG進行封裝,開發者在工具上進行簡單調用甚至點選就能搭建應用產品。
也是在同一個月,字節、百度、阿里和騰訊等多家頭部大模型企業開始打起了價格戰,先後降低自家模型產品的使用費。
“站在從業者的角度,我們不太願意看見價格戰發生,或者說我不太關注”,吳運聲告訴界面新聞,騰訊更關注能力提升,重點解決模型落地過程中的問題。
“但是作爲一個商業組織,看到市場上的降價動作,我們肯定也會有所響應”,吳運聲表示。
實際上,價格也確實是阻礙大模型廣泛落地的重要因素之一,在給大模型降價的同時,騰訊也對旗下模型產品進行了區分,根據企業的實際需求提供不同尺寸的模型。
因爲模型的大小不同,提供的能力也有所區別,推理成本更不一樣。
目前混元大模型提供混元-pro、混元-standard和混元-lite三個版本,吳運聲透露稱混元后續還將上線vision版本。
走向“機器外腦”時代
在WAIC大會現場,上海交通大學、騰訊研究院和騰訊雲智能等單位還發布了2024年AI大模型的十大趨勢報告。
這十大趨勢包括目前熱門的具身智能、算力底座、情緒智能和開源共享等技術,也包括推理分析、智能製造、遊戲環境、移動革新、人機對齊和創意生成等新趨勢。
報告認爲,海量GPU和新一代大模型組合後,使人工智能在推理分析、創意生成和情緒智能三個方向上取得突破進展,意味着AI將擁有類人的交互能力,新一代AI正在成爲人類的“機器外腦”。
此外,在GTP-4o出現後,行業正在探索多模態甚至端到端的技術演進。這也給數字人這個當下熱門的行業帶來更多新機會。
吳運聲解釋稱,現在的數字人產品,即便有知識引擎和大模型支持,也不是完全的端到端產品,而是分步驟的:首先是語音或者視頻輸入進去,進行處理之後再吐出來反饋,這個人機交互有一進一出的過程。
但在真人交流過程中,隨時會有一方打斷另一方的情況出現。大模型產品想要達到這個效果,需要更好的技術和工程化處理手段。
而今年火爆的另一個領域是智能體(AI Agent),對於它未來的技術趨勢,吳運聲認爲它會回到大語言模型的初衷,也就是用樸素的自然語言幫用戶解決問題。因爲大語言模型與傳統AI的很大區別在於,用戶對模型的輸入是一種自然表達的方式。
比如對於“我要做一個俄羅斯方塊遊戲”這種樸素的需求描述,傳統的工程做法要經過很多步驟:第一步做產品分析,第二步寫產品需求說明書,第三步做總體架構設計,第四步做詳細設計,第五步做代碼,第六步做測試等。這是一種受約束的解決方式。
“但能不能通過大模型直接做出來”,吳運聲表示,希望未來可以形成一個能解決廣泛問題的技術路線,用自然語言的方式來直接解決問題。