☰

李彥宏：未來自然語言將成爲通用編程語言，開源模型會越來越落後

4月16日上午，Create 2024百度AI開發者大會在深圳召開。百度創始人、董事長兼首席執行官李彥宏發表演講，公佈了文心一言發佈一週年的成績。

據其稱，文心一言去年3月16日正式發佈，截至目前用戶數已經突破2億，每天API的調用量突破2億，服務客戶數達到8.5萬，利用千帆平臺開發的AI原生應用數超過19萬。

李彥宏還表示，有文心4.0之後，百度可以根據需要，兼顧效果、相應速度，推理成本等各種考慮，剪裁出適合各種場景的更小尺寸模型，並且支持精調和post pretrain（一種預訓練的模型訓練方法）。

這樣通過降維剪裁出來的模型，比直接用開源模型調出來的模型，同等尺寸下，效果明顯更好；同等效果下，成本明顯更低。

基於這種對比效果，李彥宏放話稱，“開源模型會越來越落後。”

經過百度過去一年的大模型AI原生應用開發實踐，李彥宏認爲，大語言模型本身並不直接創造價值，基於大模型開發出來的AI應用才能滿足真實的市場需求，他順勢提出了三個相關行業趨勢。

首先，未來大型的AI原生應用基本都是MoE的，這裡的MoE指的是大小模型的混用，不依賴一個模型來解決所有問題。

第二是小模型。小模型推理成本低，響應速度快，在一些特定場景中，經過精調後的小模型，它的使用效果可以媲美大模型。

百度已經發布了ERNIE Speed，ERNIE Lite、ERNIE Tiny三個輕量模型，通過大模型壓縮蒸餾出一個基礎模型，然後再用數據去訓練。這比從頭開始訓小模型，效果要好很多，比基於開源模型訓出來的模型，效果、速度和成本表現都更好。

第三是智能體。智能體機制包括理解、規劃、反思和進化，它讓機器像人一樣思考和行動，可以自主完成複雜任務，在環境中持續學習、實現自我迭代和自我進化。

基於這些判斷，李彥宏稱，大模型和生成式AI將徹底改變開發者羣體，“過去開發者用代碼改變世界，未來自然語言將成爲通用編程語言。”

比如，基於文心大模型的智能代碼助手Comate，支持100多種語言和所有IDE平臺，可以推薦代碼、生成代碼註釋、查找代碼缺陷、給出優化方案，還可以解讀代碼庫、關聯私域知識生成新的代碼。

官方信息顯示，百度每天新增的代碼中，已經有27%是由Comate自動生成的；Comate還與喜馬拉雅、三菱電梯和軟通動力等上萬家企業合作，生成的代碼採納率達到46%。

“今天，你不會寫代碼，也可以做出一個應用；不用編程，也可以做出一個智能體“，李彥宏表示，未來開發應用就會像拍短視頻一樣簡單，人人都是開發者。

在發佈會上，李彥宏還介紹了百度已經推出的三款開發工具，包括：AgentBuilder、AppBuilder、ModelBuilder，它們都支持開發者打包帶走、開箱即用。

其中，智能體開發工具AgentBuilder基於基礎模型，可以批量生成，應用在各種各樣的場景。截至目前，已經有3萬多個智能體被創建、5萬多名開發者和上萬家企業入駐。

在AI原生應用開發工具上，百度提前封裝和預置了開發AI原生應用所需的各種組件和框架，大幅降低開發門檻。最快只需三步，開發者就可以用自然語言開發出一個AI原生應用，並且能夠便捷地發佈、集成到各種各樣的業務環境中。

各種尺寸的模型定製工具ModelBuilder則是更適合專業開發者使用的工具，“它可以根據開發者的需求定製任意尺寸的模型，並根據細分場景對模型進一步精調。”

相關資訊