☰

李彥宏：大模型幻覺基本消除，這是隻靠想法就能賺錢時代

整理｜褚杏娟、華衛

11 月 12 日，李彥宏在“應用來了”百度世界 2024 大會上發表了近一個小時左右的演講，期間分享了百度在大模型應用上的觀察和思考，同時展示了百度過去一年在大模型方面的成績單，主要觀點包括：

過去這 24 個月，AI 行業的最大變化是大模型基本消除了幻覺。李彥宏現場發佈檢索增強的文生圖技術 iRAG，並表示其商業價值體現在無幻覺、超真實、沒成本和立等可取。

AI 是真需求。李彥宏表示，AI 應用方向的兩個方向分別是智能體和產業應用。

智能體是 AI 應用的最主流形態，即將迎來爆發點。李彥宏表示，智能體可能會變成 AI 原生時代，內容、信息和服務的新載體。他將智能體分爲 4 種不同類型，包括公司類智能體，角色類智能體，工具類智能體和行業類智能體。

百度不是要推出一個“超級應用”，而是要打造數百萬個“超級有用”的應用。

我們將迎來一個前所未有的只靠想法就能賺錢的時代。李彥宏現場發佈無代碼工具“秒噠”，並稱之爲“迄今爲止人類歷史上最複雜的多智能體協作工具”。

下面爲演講原文，我們在不改變原義基礎上進行了刪減：

今年我們把大會的主題定成“應用來了”，這代表了我們對大模型和生成式 AI 當下的認知和判斷。

大模型火了將近兩年，相關技術以前所未有的速度進行迭代和創新，從大公司到創業者到風險投資，各路人馬大家都在尋找生成式 AI 時代基於大模型的超級應用。我們看到，這張圖是由第三方研究機構最近發佈的全球 AI 全景，基本展現了大模型和生成式 AI 爆發過程中，一浪一浪疊加的狀態。

首先是 OpenAI 發佈了 ChatGPT，後來百度發佈文心一言，緊接着就是谷歌發佈了 Bard，後來改名爲 Gemini；接着，以英偉達爲代表的芯片廠商和微軟爲代表的雲廠商吃到紅利；然後我們也看到了開源模型的奮起直追。與此同時，各類應用層的創業公司開始獲得投資，一些傳統的軟件廠商也開始用 AI 重構自己的產品。

然而客觀地講，大家期待的超級應用還沒有出現，甚至有人開始問，過去這 24 個月，這種全球性的大模型狂熱，究竟是一場新的技術革命，還是新一輪泡沫？作爲中國人工智能的扛旗者，我想我們是有資格回答這個問題的。

大家請看：這張圖這是文心大模型的日均調用量變化曲線圖，到今天這個數字已經超過了 15 億，每天調用 15 億。這是一條非常陡峭的增長曲線，在過去 18 個月當中，中國的大模型應用爆發可以用這張圖或者這個曲線來代表。說實話，這個增速是超出了我的預期的。

我記得今年 5 月份，就是 6 個月之前，當我們的人均調用量達到兩億的時候，我跟我的高管們討論大模型的未來，討論怎麼就叫成了。我當時說，如果我們的調用量日均的 API 調用量，大模型 API 調用量，一年之內如果漲 10 倍，也就是從 2 億漲到 20 億，一年時間漲 10 倍，我認爲就成了，就說明大家是真需要。現在僅僅半年過去，我們就比較接近這個數字了，勢頭非常猛。

文心 iRAG 亮相，

李彥宏：大模型基本消除幻覺

調用量漲這麼快，背後是文心大模型不遺餘力的升級進化、降本提速的過程，也是我們緊貼客戶需求，不斷髮現問題、解決問題的過程。去年三月，文心一言發佈的時候，我們說百度大模型的特色是知識增強、檢索增強。後來我們發現，檢索增強並不是百度特色，而是逐步成爲了行業的共識。檢索增強的手段，英文叫 RAG，就是 Retrieval-augmented Generation。

當然，我們是做搜索起家，這方面我們理應做得最好。這個手段的意義在哪呢？就是讓大模型基本消除了幻覺。你要想基於大模型開發應用，消除幻覺是必須的，如果這個模型總是一本正經的胡說八道，就不會有人信你，就不會有應用。有人說我用模型來寫小說，有點幻覺可能更有意思，更能引人入勝。不對！即使是文學創作，也需要故事前後保持一致，否則就不是智能而是智障了！

所以如果你要問我，過去這 24 個月，對行業而言，最大的變化是什麼？那我的回答一定是，大模型基本消除了幻覺，它回答問題的準確性大大地提升了，這讓 AI 從“一本正經的胡說八道”，變得可用、可被信賴。我們知道，大模型是一個概率模型，生成的內容是有不確定性的。但是當我們採用 RAG 技術後，大模型會利用檢索到的信息來指導文本或答案的生成，從而極大地提高了內容的質量和準確性。

今天，文字層面的 RAG 已經做得很好了，但是圖像等多模態內容和 RAG 的結合還不夠。

大家請看這張圖（下圖），這是我們用開源模型生成的一張北京天壇的圖片，看上去確實有點像天壇，但你總覺得哪兒不對。告訴大家，真正的天壇長這個樣字，是三層，但是模型生成的是四層，這是文生圖比較典型的幻覺現象。這種幻覺現象，今天仍然很普遍。所以，今天的多模態大模型沒有什麼成規模的應用出來，就是幻覺沒有解決，至少沒有像文生文 RAG 解決得那麼好。

（左：其他模型，右：百度）

今年年初，我們決定要解決這個問題。注意，就是在整個中文互聯網都爲 Sora 而“捶胸頓足、上吐下瀉”的時候，我們決定解決圖像生成的幻覺問題。這個問題看起來更簡單、甚至更枯燥，但是不解決就不會有應用。我們開發了一項顛覆性的技術叫做 iRAG，就是 image based RAG，檢索增強的文生圖技術。

之前，完全基於大語言模型的文生圖系統，生成的圖片常常是“一眼假”，甚至邏輯不合常理。百度的 iRAG，將百度搜索的億級圖片資源跟強大的基礎模型能力進行結合，這樣就可以生成各種超真實的圖片，整體效果遠遠超過文生圖的原生系統，去掉了機器味兒。

讓我們看一下這個案例，提示詞是：畫一張大衆攬巡汽車飛越長城的圖片，寫實風格。

大家看，這張圖片中的汽車跟照片一樣真實，無論是車型還是車標都沒有錯誤或者變形，它跟長城這個背景的融合度也非常高。這就是基於 iRAG 技術創作出來的一張圖片，它的內容元素、畫面氛圍都非常真實，逼近實拍的海報，但實拍你的車是飛不起來的，就像是 P 上去的一樣。

當然，你還可以讓 AI 生成這輛汽車在荒野上、城市中，在各種各樣真實場景的圖片。隨着 AI 生成圖片的可用性大大提高，它的應用空間也隨即打開了。比如在品牌宣傳場景，以前拍這樣一組海報動輒需要一二十萬，甚至大幾十萬，但是現在這種創作的成本接近於 0。

簡單說來，iRAG 的商業價值體現在：無幻覺、超真實、沒成本，而且立等可取。試想一下，如果大衆的海報生成的車型長得像豐田，那可就糟心了。

除了特定的物品，我們還可以生成特定人物跟任意場景的背景結合的照片。我們以愛因斯坦爲例，生成一張他和天壇打卡的合影。大家看是不是很像，這完全是利用 iRAG 技術生成的。

我們用同樣的提示詞，用一些開源模型生成了幾張，大家可以做一下比較。有的長得根本不像愛因斯坦，唯一一個長得像愛因斯坦的，那背景大家一看，也不是天壇。

可以說在全球範圍內，百度的 iRAG 能力都是最領先的。我們還可以通過提示詞，讓愛因斯坦遊遍全世界，比如悉尼歌劇院、復活節島巨石陣、長城、鳥巢等等，鳥巢顯然是在愛因斯坦去世後才建造的。

作爲一項基礎技術，iRAG 在很多領域都有着很好的應用空間。比如影視作品、漫畫作品、連續畫本、海報製作等，AI 生圖都可以大幅降低大家的創作成本。

智能體即將迎來爆發點

今天，基礎模型能力就緒，我們即將迎來 AI 應用的羣星閃耀時刻。每一個應用都是一顆星，每一個應用都將成爲改變世界的力量。那麼，AI 應用從哪裡來？到哪裡去？

下面，我就講講兩個大的 AI 應用方向：一個是智能體，另一個是產業應用。

我們認爲，智能體是 AI 應用的最主流形態，即將迎來它的爆發點。今天，全球所有頂尖科技公司都很關注智能體，但像百度這樣把智能體作爲最重要戰略方向的並不多。我認爲，做智能體很像在 PC 時代做網站，或者是移動時代做自媒體賬號。不同之處是智能體更像人、更智能，更像你的銷售、你的客服、你的助理。

智能體可能會變成 AI 原生時代，內容、信息和服務的新載體。爲什麼這麼說？一方面，做智能體的門檻足夠低，誰都能上手，在百度的文心智能體平臺上，甚至我們看到有 11 歲的小學生在創造智能體，然後通過搜索和其他渠道分發出去。另一方面，智能體的天花板又足夠得高，可以做出功能非常強大的應用。多個智能體的協作，還可以解決更加複雜的問題。

下面我就給大家展示一下 4 種不同類型的智能體，包括公司類智能體，角色類智能體，工具類智能體和行業類智能體。

我們首先看第一類：公司類智能體。它就相當於 AI 時代的公司官網。傳統官網具有的那些能力，比如公司介紹、產品圖片和參數展示、線下門店位置等等，公司類智能體都有，而傳統網站沒有的主動推薦、及時響應和一對一服務能力，公司智能體也有。

我們以比亞迪的智能體爲例與一個傳統官網做個比較：

在百度搜索“比亞迪”就能直接喚起它的官方智能體。點擊進入，它會先給你一段比亞迪品牌的簡短介紹，這就類似於傳統的官網。然後，你讓它推薦一臺性能均衡的車型。傳統的官網不知道什麼是性能均衡，所以沒法給你推薦，而有了大模型理解能力的智能體，就可以很好地做出篩選、給出建議，並且展示產品的圖片。

當你想比較一下看哪個值得買的時候，傳統官網上要花費比較多時間，你得在不同商品詳情頁之間來回切換，非常麻煩。而智能體可以直接把多個車型的動力類型、車身尺寸、續航、加速性能放在一起並拉出表格，非常直觀。如果你想進一步到線下門店去試駕怎麼辦？智能體可以直接調用地圖幫你一鍵導航，直達目的地。

另外，還有一點是智能體與傳統官網很不一樣的，就是對最新信息或者最個性化問題的回答。傳統的官網對外界市場信息變化往往不敏感，客服人員對於個性化的問題也難以給出令人滿意的回答，所以通常只能做記錄，再電話回訪。而智能體可以利用大模型的理解、生成、邏輯、記憶四大能力和檢索增強能力，快速從網上獲取最新、最準確的消息，並在一秒鐘之內就給出一個令人滿意的答案。

不僅是比亞迪，像聯想、沙宣、洋河這些企業，現在都已經擁有了自己的官方智能體。比起傳統的官網，智能體既是你的品牌顧問又是你的金牌銷售和客服，既專業又貼心，一對一的服務，大幅地提升了互動營銷的效率。比亞迪的官方智能體上線後，銷售線索轉化率提升了 119%。聯想 AIPC 智能體在 9 月份的互動率提升了 89%，銷售線索轉化率提升了 80%。

未來，公司官方智能體很可能會替代官網，成爲最直接的面向消費者的界面。

我們再來看第二類：角色智能體。提到角色，大家很容易想到數字人。數字人有自己的人設、自己的知識庫，這都是典型的智能體基本要素。所以當智能體機制和多模態進行有效結合時，它就變成了一個有形象、有動作，並且動作可以跟語言可以匹配起來的數字人。

之前的數字人，短板是顯而易見的。它們說話的聲音、肢體動作、口型都非常機械、呆板。但是，在大模型加持下，數字人逐漸變成了高度擬人化的智能體，更聰明、有情感、有態度。他們可能是教育輔導老師，留學顧問，也可能是心理諮詢師，私人健身教練等等。

今天，你在百度搜索“教育輔導”這樣的關鍵字，在搜索結果頁中，就能看到這些數字人。他們不僅比我們以前看到的數字人更加自然、動作幅度更大，甚至在直播場景下，還可以說着說着在合適的時機停下，回覆網友現場提出的問題。這需要大量的數據積累和直播互動規律的總結提煉。以前，我們不具備這樣的能力。今天的數字人直播，很多情況下轉化率已經超過了真人。

數字人的好處在於它的腳本完全是 AI 生成的。對於很多非常詳細的數據，真人在直播的時候是記不住的，數字人完全沒有問題。所以他的知識量，他的實際反應能力，很多時候已經超越了普通真人了。

我們非常相信，真人與虛擬人的交互，將創造巨大的產業價值和社會價值。這裡的虛擬人，可能就是現實生活中一位名師的數字分身，也可能是一位名醫、王牌律師和金牌銷售的數字分身，而你從來沒有像現在這樣離他們如此之近。

我要講的第三類智能體是工具類。工具類智能體其實是個熱門賽道，筆靈 AI 寫作、canva 設計助手、logo 生成器等都是典型的工具智能體。

百度文庫和網盤聯合開發了“自由畫布”。

我們以行業分析師寫研究報告作爲例子，來給大家介紹一下自由畫布。在很多人的認知中，行研報告就是圖文結合的內容，但今天它可以是另一種形態，有傳統的圖文、表格，也有像發佈會視頻、電話會錄音，組成一種更全的多模態報告。這在自由畫布上，可以很好地實現。

我們打開百度 APP，搜索“智能寫作”等關鍵詞，就可以找到“自由畫布”智能體，它可以幫你完成從找資料、到編輯、再到生成和分享的全部任務。不管你是內容的生產者還是消費者，都再也不用關心文件的格式是什麼、我的手機或電腦有沒有相關的應用、內存還夠不夠等等這些瑣事了。

自由畫布就是一個由文心多模態大模型加持的萬能白板，它能很好地激發人們的無限靈感和創造力。因爲自由畫布，每個孩子都能成爲故事的主角。因爲自由畫布，每個人都可以是漫畫家、成爲短視頻導演。而且，這不是期貨，而是立即可用的現貨，是真正服務於創造的新質生產力！我們很快會正式上線。

第四類智能體，我們稱之爲“行業智能體”，比如法律、醫療健康、金融、體育、旅行等等領域，都涌現出很多有用的智能體。

我們來看一個法律行業的智能體 ——法行寶。每個人工作生活中，都會遇到各類法律相關的問題，但不是每個人都能第一時間找到專業的律師來幫自己支招。這時，法行寶就很有用了。它是很受用戶歡迎的智能體，在百度的平臺上，已經回答了超過 1660 萬個問題。

我們來看看它具體能做什麼？

針對這個情況，法行寶給出了四個步驟的指導，先是保留相關證據，請求交管部門去調解，如果調解失敗，可以再提起民事訴訟、申請法院的強制執行。可以繼續諮詢：醫生說他還有三個月才能正常走路，交通事故賠償怎麼計算？這時，它會提供一個賠償計算器，要求你補充關於賠償責任、事故時間地點、傷者工作收入、傷殘認定等詳細信息，最後給出了一個事故造成的總損失和賠償金計算。

如果想靠起訴狀來拿回這筆賠償金，法行寶還可以幫你寫一封起訴狀。如果你還想找真正的名牌律師諮詢更加複雜的私人問題，法行寶還能夠按照不同領域給你推薦知名律師。上線半年多以來，法行寶爲 940 萬多人提供了高效、可信賴的法律服務，成爲了每個普通人專屬的 AI 免費律師。

目前，文心智能體平臺上，已經吸引了 15 萬家企業和 80 多萬名開發者參與，覆蓋的應用場景非常非常多。

上面顯示的就是文心智能體平臺的 TOP100 智能體，是我們基於智能體的分發量、平均對話輪次、用戶喜愛度等指標綜合遴選出來的。有角色類的，像農民院士智能體；有工具類、行業類的智能體，更有職場、情感、娛樂等類型的智能體。

大模型的產業應用

前面我講了智能體。下面我再講一下大模型的產業應用。

大模型如何在產業落地？如何爲千行百業的企業創造增量價值？這是我們一直在探索的問題。過去這一年半左右，我們看到在金融、能源、教育、招聘、公共服務等各個領域，大模型跟場景結合後，在降本和增效兩個方面都取得了實實在在的成果。

百度智能雲是我們構建智能產業生態的主要依託。目前在百度智能雲的千帆大模型平臺上，我們已經累計幫助用戶精調了 3.3 萬個大模型，開發出了 77 萬個企業級應用，百度智能雲已經擁有中國最大的大模型產業落地規模，一半以上的央國企以及很多很多的民營企業，都在聯合百度智能雲進行 AI 創新。

我們來看以下兩個案例。

百度和百勝一直有良好合作，最早是在“門店選址評估”方面，我們幫助百勝完成了新增數千家門店的選址，大幅提升了選址質量和效率。在客服領域，我們提供了客服產品和大模型能力，服務百勝旗下多個品牌，尤其是解決了原來的客服機器人，難以識別客戶真實意圖、沒法關聯上下文的問題。

目前，我們的客服應用和解決方案，已經覆蓋了百勝全線業務，大模型每天調用量的峰值達到數百萬，客服機器人的“問題解決率”提升到了 90%。

在大模型時代，百勝還需要建設一個安全可信的大模型服務專區，來滿足內部各品牌、各業務線的 AIGC 應用需求。因此，我們提供了千帆平臺、文心 Speed 模型、基礎雲算力服務等給百勝，構建了完善優質的大模型底座能力，幫助百勝更加便捷地開發和部署 AI 應用。

除此之外，我們正在和百勝一起把 ASR、TTS、大模型和數字人的技術結合起來，共同驗證在點餐屏上打造大模型點餐的能力。未來，我們還將繼續合作，共同探索企業數字化、智能化轉型等各種各樣的可能性。

下個例子是互聯網行業的代表。智聯招聘是國內領先的招聘平臺。招聘平臺最主要的工作就是把合適的人匹配到合適的崗位上。過去這個工作大量地依靠人工來完成，人工地給崗位打標籤、篩選海量的簡歷，、分析求職者對話，不僅費時費力，效果也難以保證，經常會有遺漏和錯配。

百度和智聯招聘合作，利用大模型重構了這個核心環節。通過自然語言對話，結合崗位的描述，迅速地爲求職者和崗位畫出精準的匹配畫像，並且自動回答有關工作時長、薪資福利、工作地點這些求職者關心的問題，甚至進一步幫助安排面試。

目前，百度和智聯招聘合作，已經成功沉澱出一系列提示詞模板，並在數萬條實際數據中得到了驗證，人崗匹配的平均準確率高達 93%，而大模型使用的成本卻下降了約 90%，爲招聘行業帶來了全新變革。讓每一位求職者都能更輕鬆地找到心儀工作，讓每一家企業都能更高效地獲得所需人才。

今天，我在這裡發佈基於大模型的 100 大產業應用，它涵蓋了製造、能源、交通、政務、金融、汽車、教育、互聯網等衆多行業，百度希望與更多合作伙伴和客戶一起推動智能產業生態的建設，共同來加速國家“人工智能 +”行動計劃的落地。

發佈這 100 大產業應用，其實也代表我們的認知和態度。百度不是要推出一個“超級應用”，而是要不斷地幫助更多人、更多企業打造出數百萬“超級有用”的應用。

無代碼工具“秒噠”發佈，

只靠想法就能賺錢

今天，我們的確有條件讓一行代碼都看不懂的人具備程序員的能力，有讓任何一個想法都能迅速地、低成本地變爲現實的能力。當然，這需要工具，這個工具就是今天我爲大家帶來的 One More Thing——秒噠！

一個不需要寫代碼就能夠實現任意想法的軟件，一個由大模型和智能體組成的全新的軟件，我認爲它是“迄今爲止人類歷史上最複雜的多智能體協作工具”，它包括無代碼編程、多智能體協作以及規模化地調用各種的工具等能力。

秒噠是跟任何輔助代碼生成工具是完全不一樣的，因爲它根本不需要你能看懂代碼，所以看直播的朋友們，如果你是程序員，那你現在可以不看了，這個軟件是給非程序員來用的。

我用一個例子來給大家展示一下秒噠的能力：

接收到指令後，出現了 0 號智能體，就是小組長。它是整個智能體團隊的核心，負責規劃調度。它將這個任務拆解成了需求確定、內容生產、工程開發三個步驟，並且它會召喚各個智能體來協作完成任務。

首先召喚的是 1 號智能體，是策劃智能體，負責活動邀請函的策劃、設計解決方案。1 號智能體又將這個任務拆分成：核心需求、內容結構、開發需求、數據收集四個子任務。接下來，2 號智能體就被召喚出來了，即小編智能體，主要編輯邀請函中的所有文字和媒體內容。然後，3 號智能體出場，它是程序員智能體，負責寫代碼，來製作和部署網頁，你完全不需要看懂代碼側的東西，你只要看得懂人話就行了。等它寫完後，4 號智能體質檢員出場了，它發現了一個 bug，所以把程序員智能體再叫回來，重新寫、重新改代碼，質檢員智能體會利用反思能力，運行測試代碼，看看代碼是不是跑得通。

邀請函自動生成好了，但我覺得這個畫風不夠好看，想再換一個更有科技感的。輸入想法後，程序員智能體會再寫一次代碼，給出一個新版本，這次換成了一個更有科技感的色調，有邀請函、會議日程，最後還附上了參會報名的界面，通過調用地圖的 API，嘉賓就可以一鍵導航到達會場。最後，可以在後臺看到，這條報名信息已經在統計表格中了。這樣一個發佈會的邀請系統，從你開始到最後結束，只需要 3 分鐘，用戶不用寫一行代碼，就可以完成。

整個過程體現了整個過程體現了秒噠的三個特性：無代碼編程、多智能體協作和多工具調用。無代碼編程是由大模型直接生成代碼，不需要人寫一行代碼，所以門檻大大降低了，每個人都可以去做，每個人都可上手；多智能體協作是基於文心大模型思考、規劃等能力，實現對不同類型智能體的調度、編排，這個任務共有 5 個智能體協作完成；多工具調用，像剛纔例子中調用了三個工具：網頁檢索工具、iRAG 和地圖 API 調用。

除了上面展示的邀請系統，秒噠還可以做任意場景下的各種應用，應用的複雜度也會隨着我們技術的提升不斷提升。最早開始的時候，它只能做一些比較簡單的編程，比如說兩三百行代碼，以後隨着基礎模型能力提升，以及秒噠本身技術能力的演進，它就可以做越來越多、越來越複雜的事情。

這意味着，你不需要去招募項目經理、設計人員、開發人員、測試人員等等，自己就可以指揮多個智能體來協同完成任務。也就是說，只要有想法，你就可以心想事成，我們將迎來一個前所未有的只靠想法就能賺錢的時代。

我想，AI 之所以被稱爲產業革命級的機會，就是因爲它給社會經濟帶來了生產力的無限擴張。秒噠讓每一個人都能具備程序員的能力，會說話就能做出應用來，它對於人類工作效率的提升怎麼說都不爲過。現在你就可以去排隊預約，我們明年第一季度發佈秒噠，大家就可以試用了。

今天，我們用大約一個小時的時間，回顧了過去 24 個月，全球生成式 AI 變革帶來的應用大爆發，也發佈了文心 iRAG 和無代碼秒噠兩大技術，展示了智能體、產業應用兩大應用方向的案例。可以看出，AI 應用的時代是真的來了！

當然，在人類信息技術變革的不同歷史時期，應用出現的的樣貌也不一樣：在 PC 時期，它是一個個的軟件和網站；在移動時期，它是一個個的 APP 和被關注的賬號；在 AI 時代，應用最主要的形態就是智能體。隨着大模型技術和能力的指數級躍遷，自然語言成爲了這個時代最重要的編程語言。我們每一個人都能動手創造一個屬於自己、也屬於他人的 AI 應用，或者智能體。

我是軟件工程師出身，國外有一種說法叫“軟件吞噬世界”。但我認爲，這個世界不應該被吞噬，而應該被創造。AI 時代，應用創造世界。所以請大家和我一起見證：AI applications creating the world。

會議推薦

就在 12 月 13 日 -14 日，AICon 將匯聚 70+ 位 AI 及技術領域的專家，深入探討大模型與推理、AI Agent、多模態、具身智能等前沿話題。此外，還有豐富的圓桌論壇、以及展區活動，滿足你對大模型實踐的好奇與想象。現在正值 9 折倒計時，名額有限，快掃碼諮詢瞭解詳情，別錯過這次絕佳的學習與交流機會！

李彥宏：大模型幻覺基本消除，這是隻靠想法就能賺錢時代

相關資訊