百度李彥宏:沒有應用的大模型一文不值
百度董事長兼CEO李彥宏還記得自己第一次來參加世界人工智能大會(WAIC)是在2022年,那一次大會的主題和元宇宙相關,主辦方傳話給他,希望他講一講元宇宙。他回:“我說我還是講AI吧,我講不了元宇宙”。當時,他在演講中提到自己對AI走勢的判斷:AI的技術發展路線發生了方向性改變,從過去的辨別式人工智能轉向了未來生成式人工智能。
上述預判發生在2022年的夏天,5個月之後 ,GhatGPT發佈,緊接着人工智能的又一波浪潮以前所未有的速度席捲全球。
“兩年的時間恍若隔世,整個世界都變了,人工智能可以說顛覆了絕大多數人的認知。”李彥宏在今日的WAIC演講中感慨。
他認爲,2023年國內出現百模大戰,造成社會資源的巨大浪費尤其是算力浪費,但是也使得我們追趕世界上最先進的技術模型能力得到建立。
他說,去年10月百度宣佈文心4.0發佈的時候,提到文心4.0毫不遜色GhatGPT,大家不以爲然,但現在國內很多閉源模型聲稱已經追平超越了GhatGPT。
他提到,還有一些外行混淆模型開源和代碼開源兩個概念。“模型開源拿到一大堆參數,還是要做安全對齊,你不知道這些參數怎麼來的,你是無法做到衆人拾柴火焰高,即便拿到對應源代碼也不知道用了多少數據,用了多少比例數據訓練這些參數。所以拿到這些東西,並不能夠讓你站在巨人肩膀上去迭代和開發。”
今日的演講中他再次提到大模型領域開源與閉源的路線之爭。他認爲,在同樣參數規模之下,閉源模型能力比開源模型要更好。而如果開源想要能力追平閉源,那就需要有更大的參數,這就意味着推理成本會更高,反應速度會更慢。
“很多人拿開源模型來改款,以爲這樣更好服務個性化應用。殊不知這樣創作孤本模型無法在基本模型獲益,也沒有辦法跟別人共享算力。”李彥宏說。
但與此同時,他也承認開源大模型在學術研究、教學領域等特定場景下有存在的價值,但並不適用於大多數應用場景。“當你處在一個激烈競爭市場環境當中的時候,你需要讓自己業務的效率比你的同行更高,成本比你的同行更低。這個時候商業化的閉源模型是最能打的。”
比起開源閉源路線,他認爲更重要的還是應用的落地。他提到,現在業界的關注點都放在了基礎模型身上,“一天到晚到處跑分刷榜,誰是誰又超越GhatGPT4,Open AI又出來Sora……”但事實上,沒有應用,光有一個基礎模型不管是開源還是閉源,一文不值。
他呼籲行業不要卷模型了,要去卷應用。 應用其實離大家並不遙遠,基於基準模型應用在各個領域,各行各業已經開始逐步滲透。他援引文心一言的調用量數據,兩個月前還在2億,現在已經到了5億,說明大模型背後是代表了真實的需求,有人真的從大模型當中獲益了 。
他舉個例子,在快遞領域,讓大模型幫助處理訂單,做到了一張紙一句話寄快遞而不再需要其他繁瑣流程,時間從3分鐘縮短19秒,而且90%以上的問題都是由大模型解決,效率提升非常明顯。在小說創作領域,網文作者有了AI的助力“如虎添翼”。而類似於代碼生成的軟件,在各個領域也在逐步滲透。李彥宏透露,百度內部我們有30%左右的代碼已經是用AI生成了,代碼採用率超過44%。
因此,李彥宏提出業界要避免掉入“超級應用陷阱”,認爲一定要出現一個10億DAU的APP才叫成功,這是移動時代的思維邏輯。AI時代,規律可能不是這樣的,“超級能幹”的應用比只看DAU的“超級應用”更重要,只要對產業、對應用場景能產生大的增益,整體價值就比移動互聯網要大多了。
智能體是他最看好的AI發展方向。他判斷,未來在醫療、金融、教育、製造、交通、農業等等領域都會依照自己場景,自己特有經驗規則數據等等做出各種各樣智能體將來有數以百萬量級智能體出現,形成龐大的智能體生態。
AI正在以前所未有的速度向各行各業滲透。很多人擔心,人類是不是就沒有工作機會了?李彥宏說自己聽到的抱怨很多,建設性意見很少,很少有人去致力於發掘生成式AI帶來的新的工作機會。
李彥宏說,已經看到有一些全新的工作冒出來,比如說提示詞工程師。這個職業未來不用編程,但需要用很強的邏輯性把工作流說清楚,要用提示詞對模型進行調教,隨着智能體大量涌現,這種工作需求也會飆升。“這些工作機會通常門檻並不高,你做的一般也能夠養家餬口,做得好上限可以年薪百萬。”