螞蟻集團CTO:大模型還處於鑽木取火階段,能用但太貴了

·Scaling law(尺度定律)在逃避一個現實,我們今天並沒有找到AI產生如此效果的本質,沒有人能用數學的方法描述它。這就好比鑽木取火,火有用處,但鑽木並非最好的方法。今天的AI依然處在鑽木取火階段,因此成本高昂。

“我開玩笑說沒想到AI時代會以這麼快的方式進入到 ‘補貼互聯網’時代,但本質上來講,技術價格一定會下降。”5月28日,在第九屆螞蟻技術日上,螞蟻集團CTO何徵宇表示,大模型仍處於鑽木取火階段,規模落地需要攻堅三大挑戰:可靠性、經濟性、易用性。

其中,可靠性是在技術層面用AI監督AI,以解決控制和“對齊”模型。經濟性是把大模型做“小”,這決定了大模型應用能否成爲主流。易用性則是將智能“傻瓜化”,進一步降低C端門檻,這決定了生成式AI是否能規模化落地應用,紮根C端。

可靠性、經濟性、易用性

任何技術真正落地時必須解決可靠性問題,如果一個技術不可靠,便只是實驗室產物或玩具。“今天AI在90%的時間裡是可靠的,但10%的時間不可靠,說糊話、瞎話,這是不可靠的,AI生成式大模型必須克服這一點,否則它永遠只是一個工具而不是產業。”何徵宇表示,“螞蟻集團資損率小於億分之一,達到這種級別才能說改變了行業,能夠進行規模化的技術適用。”

大模型時代,AI的可靠性要用AI監督AI,以解決控制和“對齊”模型。“大模型的每一個Token是預測出來,預測就一定會有誤差,誤差累積到一定程度,模型就一定會胡說八道。本質上是要控制數據流怎麼流進模型以及怎麼輸出,實現足夠小的誤差範圍,以及誤差不要累積。”

“創投圈愛講PMF(Product Market Fit,產品市場匹配度),但現在多了一個詞,叫TC-PMF(Technology Cost-PMF,技術成本和產品市場匹配度),因爲AI這個東西太貴了。”何徵宇表示,之所以貴,是因爲產生智能效果的方法有些笨拙,甚至不聰明。

“Scaling law(編者注:尺度定律,意思是隨着模型、數據集、用於訓練的計算浮點數的增加,模型的性能會提高)在逃避一個現實,我們今天並沒有找到AI產生如此效果的本質,沒有人能用數學的方法描述它,找到它的規律。” 何徵宇認爲,這就好比原始人鑽木取火,火有用處,但鑽木並非最好的方法。今天的AI依然處在鑽木取火階段,因此成本高昂。

在巨大資源投入下,雲廠商免費提供API(應用程序編程接口),國內大模型已從參數規模、性能指標“卷”到了Token價格,大模型掀起價格戰。“我開玩笑說沒想到AI時代會以這麼快的方式進入到 ‘補貼互聯網’時代。但本質上來講,技術價格一定會下降。”儘管何徵宇認爲這是逆市場行爲,但代表了大量資源涌向大模型領域,螞蟻也會繼續沿着這條路投入資源。

“另一方面,我們需要嘗試尋找一條真正的路。我們站在中國科技的角度,而不只是站在全世界大同的角度,我們迫切需要第二條路。如果我們緊跟着Transformer這套緊耦合的算法結構+芯片路線,彎道超車非常難,我們必須要有新的方法、新的理念、新的探索。”何徵宇表示,螞蟻集團正在積極投入,最終目標是產生能夠超越這一代人工智能的能力。

在何徵宇看來,任何一個技術要真正面向全體大衆生根發芽,技術門檻必須足夠低,做到易用。“今天的AI如果要成爲超級入口,必須要進一步降低C端門檻。如果還在想着怎麼用更好的提示,讓ChatGPT的反應更好一點,這意味着它的門檻太高了。”易用性是要將智能“傻瓜化”,這決定了生成式AI是否能規模化落地應用。

AI不爲替代人而生

基於大規模業務場景需求,螞蟻佈局了知識圖譜、運籌優化、圖學習、可信AI、大模型等AI技術,螞蟻百靈大模型去年底完成備案,生活管家“支付寶智能助理”、金融管家“支小寶”、數字健康人“安診兒”三個智能管家是螞蟻百靈大模型的核心創新應用產品。

“很多產品從To C角度講,似乎很難讓每一個人都獲益。但我們希望AI像掃碼支付一樣,能夠便利每個人的生活。”何徵宇表示,AI不爲替代人而生,也不能變成少數人的AI,而是爲每一個人而生。

“以生活管家支付寶智能助理爲例,它連接了400萬商家機構小程序和8000項數字生活服務,食住行遊購娛等生活服務均可問可辦。”何徵宇表示,“這就是每個人都需要的便捷工具。”此外,浙江省衛健委與支付寶聯合推出了可陪診的數字健康人“安診兒”,浙江省內用戶就醫時可感受全流程的陪伴、指引、互動。 “浙江省人民醫院跟我們說,用了 ‘安診兒’後,一樓導診臺流量下降了50%,特別是對老年人、異地就醫患者比較友好。我們不僅僅將數字化轉化爲智能化,而且更好地消滅數字鴻溝。”

何徵宇表示,“現在大模型大多數在打榜、做奧數題,智能管家並不需要奧數冠軍,而是需要極其靠譜。我們深耕的是嚴謹產業,我們更加希望大模型是一個靠譜的大模型。”他希望三個智能管家規模化服務億級用戶,端側模型配合雲側模型,降低成本。