李彥宏:未來自然語言將成爲通用編程語言,開源模型會越來越落後
4月16日上午,Create 2024百度AI開發者大會在深圳召開。百度創始人、董事長兼首席執行官李彥宏發表演講,公佈了文心一言發佈一週年的成績。
據其稱,文心一言去年3月16日正式發佈,截至目前用戶數已經突破2億,每天API的調用量突破2億,服務客戶數達到8.5萬,利用千帆平臺開發的AI原生應用數超過19萬。
李彥宏還表示,有文心4.0之後,百度可以根據需要,兼顧效果、相應速度,推理成本等各種考慮,剪裁出適合各種場景的更小尺寸模型,並且支持精調和post pretrain(一種預訓練的模型訓練方法)。
這樣通過降維剪裁出來的模型,比直接用開源模型調出來的模型,同等尺寸下,效果明顯更好;同等效果下,成本明顯更低。
基於這種對比效果,李彥宏放話稱,“開源模型會越來越落後。”
經過百度過去一年的大模型AI原生應用開發實踐,李彥宏認爲,大語言模型本身並不直接創造價值,基於大模型開發出來的AI應用才能滿足真實的市場需求,他順勢提出了三個相關行業趨勢。
首先,未來大型的AI原生應用基本都是MoE的,這裡的MoE指的是大小模型的混用,不依賴一個模型來解決所有問題。
第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過精調後的小模型,它的使用效果可以媲美大模型。
百度已經發布了ERNIE Speed,ERNIE Lite、ERNIE Tiny三個輕量模型,通過大模型壓縮蒸餾出一個基礎模型,然後再用數據去訓練。這比從頭開始訓小模型,效果要好很多,比基於開源模型訓出來的模型,效果、速度和成本表現都更好。
第三是智能體。智能體機制包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成複雜任務,在環境中持續學習、實現自我迭代和自我進化。
基於這些判斷,李彥宏稱,大模型和生成式AI將徹底改變開發者羣體,“過去開發者用代碼改變世界,未來自然語言將成爲通用編程語言。”
比如,基於文心大模型的智能代碼助手Comate,支持100多種語言和所有IDE平臺,可以推薦代碼、生成代碼註釋、查找代碼缺陷、給出優化方案,還可以解讀代碼庫、關聯私域知識生成新的代碼。
官方信息顯示,百度每天新增的代碼中,已經有27%是由Comate自動生成的;Comate還與喜馬拉雅、三菱電梯和軟通動力等上萬家企業合作,生成的代碼採納率達到46%。
“今天,你不會寫代碼,也可以做出一個應用;不用編程,也可以做出一個智能體“,李彥宏表示,未來開發應用就會像拍短視頻一樣簡單,人人都是開發者。
在發佈會上,李彥宏還介紹了百度已經推出的三款開發工具,包括:AgentBuilder、AppBuilder、ModelBuilder,它們都支持開發者打包帶走、開箱即用。
其中,智能體開發工具AgentBuilder基於基礎模型,可以批量生成,應用在各種各樣的場景。截至目前,已經有3萬多個智能體被創建、5萬多名開發者和上萬家企業入駐。
在AI原生應用開發工具上,百度提前封裝和預置了開發AI原生應用所需的各種組件和框架,大幅降低開發門檻。最快只需三步,開發者就可以用自然語言開發出一個AI原生應用,並且能夠便捷地發佈、集成到各種各樣的業務環境中。
各種尺寸的模型定製工具ModelBuilder則是更適合專業開發者使用的工具,“它可以根據開發者的需求定製任意尺寸的模型,並根據細分場景對模型進一步精調。”