李彥宏駁大模型泡沫論:文心日調用量15億 智能體全面爆發(附演講全文)

11月12日消息,百度世界2024公佈,截至11月初,百度文心大模型的日均調用量已經超過15億,相較一年前首次披露的5000萬次,增長約30倍。百度CEO李彥宏表示“增速超出預期”,說明AI是真需求。他感慨,這條陡峭的增長曲線,代表着過去兩年中國大模型應用的爆發。

李彥宏談到,過去24個月,AI行業的最大變化是什麼?是大模型基本消除了幻覺。對此,百度發佈兩大賦能應用的AI技術:檢索增強的文生圖技術(iRAG)和無代碼工具“秒噠”。文心iRAG用於解決大模型在圖片生成上的幻覺問題,極大提升實用性;無代碼技術“秒噠”讓每個人都擁有程序員的能力,將打造數百萬“超級有用”的應用。

在AI應用的發展趨勢上,李彥宏表示,智能體是AI應用的最主流形態,即將迎來爆發點。

現場,他依次講解了公司、角色、工具和行業四大類智能體,將做智能體類比爲PC時代做網站、或是移動時代做自媒體賬號,“不同之處是智能體更像人、更智能,更像你的銷售、客服和助理。智能體可能會變成AI原生時代,內容、信息和服務的新載體。”

演講中,他還展示了文心智能體平臺TOP100智能體和TOP100產業應用,並表明 “百度不是要推出一個‘超級應用’,是要幫助更多人、更多企業打造出數百萬‘超級有用’的應用”。當天發佈的無代碼工具“秒噠”,具備無代碼編程、多智能體協作和多工具調用三大特性,用自然語言就能搭建一整套系統,將開啓一個“只靠想法就能賺錢的時代”。(定西)

以下爲李彥宏演講全文:

各位來賓,歡迎參加百度世界2024大會!每年我們都用這個機會,向大家展示百度在過去一年當中,百度在技術創新方面的最新成果,今年我們把大會的主題定成“應用來了”,這代表了我們對大模型和生成式AI當下的認知和判斷。

大模型火了將近兩年,相關技術以前所未有的速度進行迭代和創新,從大公司,到創業者,到風險投資,各路人馬大家都在尋找生成式AI時代基於大模型的超級應用。 我們看到,這張圖是由第三方研究機構最近發佈的全球AI全景,基本展現了大模型和生成式AI爆發過程中,一浪一浪疊加的狀態。首先是OpenAI發佈了ChatGPT,後來百度發佈文心一言,緊接着就是谷歌發佈了Bard,後來改名爲Gemini;接着,以英偉達爲代表的芯片廠商和微軟爲代表的雲廠商吃到紅利;然後我們也看到了開源模型的奮起直追。與此同時,各類應用層的創業公司開始獲得投資,一些傳統的軟件廠商也開始用AI重構自己的產品。然而客觀地講,大家期待的超級應用還沒有出現,甚至有人開始問,過去這24個月,這種全球性的大模型狂熱,究竟是一場新的技術革命,還是新一輪泡沫?

作爲中國人工智能的扛旗者,我想我們是有資格回答這個問題的。 大家請看:這張圖這是文心大模型的日均調用量變化曲線圖,到今天這個數字已經超過了15億,每天調用15億。這是一條非常陡峭的增長曲線,在過去18個月當中,中國的大模型應用爆發可以用這張圖或者這個曲線來代表。說實話,這個增速是超出了我的預期的。我記得今年5月份,就是6個月之前,當我們的人均調用量達到兩億的時候,我跟我的高管們討論,討論大模型的未來,討論怎麼就叫成了。我當時說,如果我們的調用量日均的API調用量,大模型API調用量,一年之內如果漲10倍,也就是從2億漲到20億,一年時間漲10倍,我認爲就成了,就說明大家是真需要。現在僅僅半年過去,我們就比較接近這個數字了,勢頭非常猛。

調用量漲這麼快,背後是文心大模型不遺餘力的升級進化、降本提速的過程,也是我們緊貼客戶需求,不斷髮現問題、解決問題的過程。去年三月,文心一言發佈的時候,我們說百度大模型的特色是知識增強、檢索增強。後來我們發現,檢索增強並不是百度特色,而是逐步成爲了行業的共識。檢索增強的手段,英文叫RAG,就是Retrieval-augmented Generation。

當然,我們是做搜索起家嘛,這個方面我們理應做得最好。這個手段的意義在哪呢?它就是讓大模型基本消除了幻覺。你要想基於大模型開發應用,消除幻覺是必須的,如果這個模型總是一本正經的胡說八道,就不會有人信你,就不會有應用。有人說我用模型來寫小說,有點幻覺可能更有意思,更能引人入勝,不對!即使是文學創作,也需要故事前後保持一致,否則就不是智能而是智障了!

所以如果你要問我,過去這24個月,對行業而言,最大的變化是什麼?那我的回答一定是,大模型基本消除了幻覺,它回答問題的準確性大大地提升了,這讓AI從“一本正經的胡說八道”,變得可用、可被信賴。我們知道,大模型是一個概率模型,生成的內容是有不確定性的。但是當我們採用RAG技術後,大模型會利用檢索到的信息來指導文本或答案的生成,從而極大地提高了內容的質量和準確性。

今天,文字層面的RAG已經做得很好了,但是圖像等多模態內容和RAG的結合還不夠。 大家請看這張圖,這是我們用開源模型生成的一張北京天壇的圖片,看上去確實有點像天壇,但你總覺得哪兒不對。

告訴大家,真正的天壇長這個樣字,是三層,但是模型生成的是四層,這是文生圖比較典型的幻覺現象。這種幻覺現象,今天仍然很普遍,所以今天的多模態大模型,沒有什麼成規模的應用出來。就是幻覺沒有解決,至少沒有像文生文RAG解決得那麼好。

今年年初,我們決定要解決這個問題。注意,就是在整個中文互聯網都爲Sora而捶胸頓足上吐下瀉的時候,我們去決定解決圖像生成的幻覺問題。這個問題看起來更簡單、甚至更枯燥,但是不解決就不會有應用。我們開發了一項顛覆性的技術叫做iRAG,就是image based RAG,檢索增強的文生圖技術。

之前,完全基於大語言模型的文生圖系統,生成的圖片常常是“一眼假”,甚至邏輯不合常理。百度的iRAG,將百度搜索的億級圖片資源跟強大的基礎模型能力進行結合,這樣就可以生成各種超真實的圖片,整體效果遠遠超過文生圖的原生系統,去掉了機器味兒。 讓我們看一下這個案例,提示詞是:

畫一張大衆攬巡汽車飛越長城的圖片,寫實風格。

大家看,這張圖片中的汽車跟照片一樣真實,我們放大看一下。

無論是車型還是車標,都沒有錯誤或者變形,它跟長城這個背景的融合度,也非常高。這就是基於iRAG技術創作出來的一張圖片,它的內容元素、畫面氛圍都非常真實,逼近實拍的海報,但實拍你的車是飛不起來的,就像是P上去的一樣。

當然,你還可以讓AI生成這輛汽車在荒野上、城市中,在各種各樣真實場景的圖片。隨着AI生成圖片的可用性大大提高,它的應用空間也隨即打開了。比如在品牌宣傳場景,以前拍這樣一組海報動輒需要一二十萬,甚至大幾十萬,但是現在這種創作的成本接近於0。

簡單說來,iRAG的商業價值體現在:無幻覺、超真實、沒成本,而且呢,立等可取。試想一下,如果大衆的海報生成的車型長得像豐田,那可就糟心了。

除了特定的物品,我們還可以生成特定人物跟任意場景的背景結合的照片。 我們以愛因斯坦爲例,生成一張他和天壇打卡的合影。大家看是不是很像,這完全是利用iRAG技術生成的。

我們用同樣的提示詞,用一些開源模型生成了幾張,大家可以做一下比較。有的長得根本不像愛因斯坦,唯一一個長得像愛因斯坦的,那背景大家一看,也不是天壇。

可以說在全球範圍內,百度的iRAG能力都是最領先的。我們還可以通過提示詞, 讓愛因斯坦遊遍全世界,比如悉尼歌劇院、復活節島巨石陣、長城、鳥巢等等,鳥巢顯然是在愛因斯坦去世後才建造的。

作爲一項基礎技術,iRAG在很多領域都有着很好的應用空間。比如,影視作品、漫畫作品,連續畫本,海報製作等,AI生圖都可以大幅降低大家的創作成本。

今天,基礎模型能力就緒,我們即將迎來AI應用的羣星閃耀時刻。每一個應用都是一顆星,每一個應用都將成爲改變世界的力量。

那麼,AI應用從哪裡來?到哪裡去?

下面,我就講講兩個大的AI應用方向:一個是智能體,另一個是產業應用。

我們認爲,智能體是AI應用的最主流形態,即將迎來它的爆發點。

今天,全球所有頂尖科技公司都很關注智能體,但像百度這樣把智能體作爲最重要戰略方向的並不多。我認爲,做智能體很像在PC時代做網站,或者是移動時代做自媒體賬號。不同之處是智能體更像人,更智能,更像你的銷售,像你的客服,像你的助理。 智能體可能會變成AI原生時代,內容、信息和服務的新載體。

爲什麼這麼說?一方面,做智能體的門檻足夠低,誰都能上手,在百度的文心智能體平臺上,甚至我們看到有11歲的小學生在創造智能體,然後通過搜索和其他渠道分發出去。另一方面,智能體的天花板又足夠的高,可以做出功能非常強大的應用。多個智能體的協作,還可以解決更加複雜的問題。今天呢,在最後的環節,我會給大家展示一個多智能體協作解決複雜問題的最驚豔的例子。

下面我就給大家展示一下4種不同類型的智能體,包括公司類智能體,角色類智能體,工具類智能體和行業類智能體。

我們首先看第一類,公司類智能體。它就相當於AI時代的公司官網。傳統官網具有的那些能力,比如公司介紹、產品圖片和參數展示、線下門店位置等等,公司類智能體都有。而傳統網站沒有的主動推薦、及時響應和一對一服務能力,公司智能體也有。

我們以比亞迪的智能體爲例,和一個傳統官網做個比較。

在百度搜索“比亞迪”,就能直接喚起它的官方智能體。點擊進入,它會首先給你一段比亞迪品牌的簡短介紹,這就類似於傳統的官網。

然後,你讓它推薦一臺性能均衡的車型。什麼叫“性能均衡”,傳統的官網不知道什麼是性能均衡,所以沒法兒給你推薦,而有了大模型理解能力的智能體,就可以很好地做出篩選,給出建議,並且展示產品的圖片。

當你對幾個車型都有興趣,想比較一下,看哪個值得買的時候,在傳統的官網上是要花費比較多時間的。因爲每個車型對應的商品詳情頁都是單獨的,你得在不同商品詳情頁之間來回切換着看,非常麻煩。而智能體可以直接給你把多個車型的動力類型、車身尺寸、續航、加速性能放在一起拉出表格來,非常直觀。

如果,你想進一步到線下門店去試駕怎麼辦?智能體可以直接調用地圖,幫你一鍵導航,直達目的地。

另外,還有一點是智能體與傳統官網很不一樣的,那就是對最新信息或者最個性化問題的回答。傳統的官網,對外界市場信息變化往往不敏感,客服人員對於個性化的問題也難以給出令人滿意的回答,所以通常只能做記錄,再電話回訪。而智能體可以利用大模型的理解、生成、邏輯、記憶四大能力和檢索增強能力,快速從網上獲取最新、最準確的消息,並在一秒鐘之內就給出一個令人滿意的答案。

如果你還有更復雜的問題,智能體也可以通過不斷地跟你澄清、互動、反問,來最終滿足你的需求。

不僅是比亞迪,像聯想、沙宣、洋河這些企業,現在都已經擁有了自己的官方智能體。比起傳統的官網,智能體既是你的品牌顧問又是你的金牌銷售和客服,既專業又貼心,一對一的服務,大幅地提升了互動營銷的效率。 比亞迪的官方智能體上線後,銷售線索轉化率提升了119%。聯想AIPC智能體在9月份的互動率提升了89%,銷售線索轉化率提升了80%。

未來,公司官方智能體很可能會替代官網,成爲最直接的面向消費者的界面。

我們再來看 第二類,角色智能體。提到角色,大家很容易想到數字人。數字人有自己的人設、自己的知識庫,這都是典型的智能體基本要素。

所以當智能體機制和多模態進行有效結合的時候,它就變成了一個有形象、有動作,並且動作可以跟語言可以匹配起來的數字人。之前的數字人,短板是顯而易見的。它們說話的聲音、肢體動作、口型都非常機械、呆板。但是,在大模型加持下,數字人逐漸變成了高度擬人化的智能體,更聰明、有情感、有態度。他們可能是教育輔導老師,留學顧問,也可能是心理諮詢師,私人健身教練等等,都非常受歡迎。

今天, 你在百度搜索“教育輔導”這樣的關鍵字,在搜索結果頁中,就能看到這些數字人。他們不僅比我們以前看到的數字人更加自然、動作幅度更大,甚至在直播場景下,還可以說着說着,在合適的時機停下,回覆網友現場提出的問題。這需要大量的數據積累和直播互動規律的總結提煉,以前,我們是不具備這樣的能力。所以今天的數字人直播,很多情況下,轉化率已經超過了真人。

這些數字人,動作、語言、口型非常自然,如果不說的話,你都不知道是數字人。數字人的好處在於它的腳本完全是AI生成的,很多數據,非常詳細的數據,真人在直播的時候,他是記不住的,數字人完全沒有問題。所以他的知識量,他的實際反應能力,很多時候是超越了普通真人了已經。

我們非常地相信,真人與虛擬人的交互,將創造巨大的產業價值和社會價值。這裡的虛擬人,可能就是現實生活中的一位名師的數字分身,也可能是一位名醫、王牌律師和金牌銷售的數字分身,而你從來沒有像現在這樣離他們如此之近。

我要講的第三類智能體是工具類。工具類智能體其實是個熱門賽道。筆靈AI寫作、canva設計助手、logo生成器等等,這些都是典型的工具智能體。

下面,我給大家展示一個全新的工具類智能體,是由百度文庫和網盤聯合開發的“自由畫布”。我們以行業分析師寫研究報告作爲例子,來給大家介紹一下自由畫布。在很多人的認知中,行研報告就是圖文結合的內容。但今天,它可以是另一種形態,有傳統的圖文、表格,也有像發佈會視頻、電話會錄音,組成一種更全的多模態報告。這在自由畫布上,可以很好地實現。我們來看一下,什麼叫做自由畫布。

首先,我們打開百度APP,搜索“智能寫作”等關鍵詞,就可以找到“自由畫布”智能體,它可以幫你完成從找資料、到編輯、再到生成和分享的全部任務。

第一步,輸入自由。自由畫布打通了公域和私域的數據,比如,文庫上公開的高質量文檔或片段,外部網頁公開的這些內容,可以一鍵摘錄到自由畫布。來自私域的內容,比如你在像網盤聽記上記錄的多場電話會議的音頻,比如你在收藏在網盤裡的專業視頻和深度調研報告等等,不限格式、不限來源,全部都可以拖到畫布上。這是輸入自由。

第二步,編輯自由:你不再需要去做居中、調字號、排版等基礎繁雜的工作。我們今天,重新定義了編輯,讓用戶成爲總指揮,通過批註的方式告訴AI,如何利用素材,也可以圈選出最需要的內容片段,或者原封不動要複用的部分,這樣就能確保生成的內容,完全符合你的真實想法。

第三步,我們叫做創作自由:劃好重點之後,框選全部需要的素材一鍵生成,AI就會根據輸入和要求開始思考,在對應章節下利用相關素材,生成一個結構清晰的、全新的富媒體內容。

當然,你也可以打開這些文檔,再做局部的編輯,以及改寫、擴寫、續寫。實現一邊在畫布上捋思路,做草稿,一邊在文檔上完善細化,一站式解決各種各樣的問題。

最後,我們叫做分享自由:最終生成的內容可以保存在本地,也可以上傳在用戶的個人雲上,還可以用一個鏈接分享出去,無論是行業交流羣、朋友圈或者其他平臺,都可以直接打開鏈接觀看播放。

所以不管你是內容的生產者還是消費者,都再也不用關心文件的格式是什麼、我的手機或電腦有沒有相關的應用、內存還夠不夠等等這些瑣事了。

除了上面這種辦公場景,我再給大家演示一個偏向於個人創作場景的案例。大家知道今年“黑神話悟空”很火,我們想讓AI幫我們放飛想象,看看大聖穿越到現代,會發生什麼?

自由畫布根據我的要求,生成了一個大聖穿越到現代探險的故事。

那我們是不是可以基於這個故事,生成一幅漫畫呢? 當然可以!你們看,在漫畫中,孫悟空遊覽了山西幾個打卡聖地,最後來到了上海。大家注意看,不同圖片中的孫悟空,它的一致性是非常好的,前後看着都像一個孫悟空,還結合故事情節做出了對應的動作。

漫畫很生動。我們能不能讓AI生成視頻?我們來看一下:

所以大家看到,原本漫畫中的對白,變成了字幕和配音,讓故事更加生動。

那如果我們腦洞再大一點,讓一個小朋友穿越到花果山怎麼樣?其實很簡單,你只需要上傳一張小朋友自己的照片,就能讓他融入到這個個人定製畫本中。你們看,自由畫布已經生成了一個小朋友夢遊花果山的故事。接下來,點擊製作畫本就可以了,畫面中小朋友的神態和真人照片可以做得非常相似。

講到這呢,大家可以感覺到,自由畫布就是一個由文心多模態大模型加持的萬能白板,它能很好地激發人們的無限靈感和創造力。因爲自由畫布,每個孩子都能成爲故事的主角。因爲自由畫布,每個人都可以是漫畫家、成爲短視頻導演。而且,這不是期貨,而是立即可用的現貨,是真正服務於創造的新質生產力!我們很快會正式上線。

第四類智能體, 我們稱之爲“行業智能體”。比如法律、醫療健康、金融、體育、旅行等等領域,都涌現出很多有用的智能體。

我們來看一個法律行業的智能體 ——法行寶。

每個人工作生活中,都會遇到各類法律相關的問題,但不是每個人都能第一時間找到專業的律師來幫自己支招。這時,法行寶就很有用了。它是很受用戶歡迎的智能體,在百度的平臺上,已經回答了超過1660萬個問題。

我們來看看它 具體能做什麼?

我有一個朋友昨天被車撞了,現在躺在醫院花了很多錢,報警後,警察說是對方全責,但對方不給賠償,該怎麼辦?

針對這個情況,法行寶給出了四個步驟的指導,先是保留相關證據,請求交管部門去調解,如果調解失敗,可以再提起民事訴訟、申請法院的強制執行。你可能還想知道,如果賠償,能獲得多少賠償金?這也可以繼續諮詢:

醫生說他還有三個月才能正常走路,交通事故賠償怎麼計算?

這時,它會提供一個賠償計算器,要求你補充關於賠償責任、事故時間地點、傷者工作收入、傷殘認定等詳細信息,最後給出了一個事故造成的總損失和賠償金計算。

如果想靠起訴狀來拿回這筆賠償金,法行寶還可以幫你寫一封起訴狀:

幫我寫一封交通事故起訴狀。

和之前一樣,它會繼續詢問身份、代理人這些詳細信息,然後幫你生成。我們看到,現在起訴狀寫好了,填上事實細節就可以使用。所以,法行寶不僅能像專業律師一樣給出專業解答,還能調用大模型的生成能力,生成起訴狀。

當然,如果你還想找真正的名牌律師諮詢更加複雜的私人問題,法行寶還能夠按照不同領域給你推薦知名律師,來提供進一步幫助。

上線半年多以來,法行寶爲940萬多人提供了高效、可信賴的法律服務,成爲了每個普通人專屬的AI免費律師。

目前,文心智能體平臺上,已經吸引了15萬家企業和80多萬名開發者參與,覆蓋的應用場景非常非常多。

現在大屏上顯示的,就是文心智能體平臺的TOP100智能體。是我們基於智能體的分發量、平均對話輪次、用戶喜愛度等指標綜合遴選出來的。有角色類的,像農民院士智能體,有工具類、行業類的智能體,更有職場、情感、娛樂等類型的智能體。

百度還邀請英偉達作爲技術合作夥伴,共同發起了“文心智能體創新大賽”,大賽涌現出很多有價值的智能體應用。

前面我講了智能體。下面我再講一下大模型的產業應用。

大模型如何在產業落地?如何爲千行百業的企業創造增量價值?這是我們一直在探索的問題。過去這一年半左右,我們看到在金融、能源、教育、招聘、公共服務等各個領域,大模型跟場景結合後,在降本和增效兩個方面都取得了實實在在的成果。

百度智能雲是我們構建智能產業生態的主要依託。目前在百度智能雲的千帆大模型平臺上,我們已經累計幫助用戶精調了3.3萬個大模型,開發出了77萬個企業級應用,百度智能雲已經擁有中國最大的大模型產業落地規模,一半以上的央國企以及很多很多的民營企業,都在聯合百度智能雲進行AI創新。

我們來看以下兩個案例:

一個是大型企業的代表——百勝中國。大家知道這是國內規模最大的餐飲公司,我們經常光顧的肯德基、必勝客,都是百勝旗下品牌。百度和百勝一直有良好合作,最早是在『門店選址評估』方面,我們幫助百勝完成了新增數千家門店的選址,大幅提升了選址質量和效率。在客服領域,我們提供了客服產品和大模型能力,服務百勝旗下多個品牌。尤其是解決了原來的客服機器人,難以識別客戶真實意圖、沒法關聯上下文的問題。

目前,我們的客服應用和解決方案,已經覆蓋了百勝全線業務,大模型每天調用量的峰值達到數百萬,客服機器人的『問題解決率』提升到了90%。在大模型時代,百勝還需要建設一個安全可信的大模型服務專區,來滿足內部各品牌、各業務線的AIGC應用需求。

因此,我們提供了千帆平臺、文心Speed模型、基礎雲算力服務等給百勝,構建了完善優質的大模型底座能力,幫助百勝更加便捷地開發和部署AI應用。

除此之外,我們正在和百勝一起,把ASR、TTS、大模型和數字人的技術結合起來,共同驗證在點餐屏上打造大模型點餐的能力。

未來,我們還將繼續合作,共同探索企業數字化、智能化轉型等各種各樣的可能性。

下個例子是互聯網行業的代表。智聯招聘是國內領先的招聘平臺。

招聘平臺最主要的工作就是把合適的人匹配到合適的崗位上。過去這個工作大量地依靠人工來完成,人工地給崗位打標籤,人工地去篩選海量的簡歷,人工地去分析求職者的對話,不僅費時費力,效果也難以保證,經常會有遺漏和錯配。

百度和智聯招聘合作,利用大模型重構了這個核心環節。通過自然語言對話,結合崗位的描述,迅速地爲求職者和崗位畫出精準的匹配畫像,並且自動回答有關工作時長、薪資福利、工作地點這些求職者關心的問題,甚至進一步幫助安排面試。既爲求職者推薦了合適的職位,也爲用人單位精準篩選出所需的人才,顯著提高了用人單位的招聘效率和質量。目前,百度和智聯招聘合作,已經成功沉澱出一系列提示詞模板,並在數萬條實際數據中得到了驗證,人崗匹配的平均準確率高達93%,而大模型使用的成本卻下降了約90%,爲招聘行業帶來了全新變革,。

讓每一位求職者都能更輕鬆地找到心儀工作,讓每一家企業都能更高效地獲得所需人才。

今天,我在這裡發佈基於大模型的100大產業應用,它涵蓋了製造、能源、交通、政務、金融、汽車、教育、互聯網等衆多行業,百度希望與更多合作伙伴和客戶一起推動智能產業生態的建設,共同來加速國家“人工智能+”行動計劃的落地。

發佈這100大產業應用,其實也代表我們的認知和態度。百度不是要推出一個“超級應用”,而是要不斷地幫助更多人、更多企業打造出數百萬“超級有用”的應用。

今天,我們的確有條件讓一行代碼都看不懂的人具備程序員的能力,有讓任何一個想法都能迅速地、低成本地變爲現實的能力。當然,這需要工具,這個工具就是我爲大家帶來的、今天的One More Thing——秒噠!

一個不需要寫代碼就能夠實現任意想法的軟件,一個由大模型和智能體組成的全新的軟件,我認爲它是“迄今爲止人類歷史上最複雜的多智能體協作工具”,它包括無代碼編程、多智能體協作以及規模化地調用各種的工具等能力。

注意,秒噠是跟任何輔助代碼生成工具是完全不一樣的,因爲它根本不需要你能看懂代碼,所以看直播的朋友們,如果你是程序員,那你現在可以不看了,這個軟件是給非程序員來用的。

我用一個例子來給大家展示一下秒噠的能力:

假設我們要爲蘿蔔快跑開個新技術發佈會。 我需要打造一個活動邀請系統,把邀請函分享給其他人,並且收集他們的想法和反饋。首先,上傳了一個有大會時間地點主題的文件給秒噠。

我們來看看,秒噠將如何滿足我這個需求。接收到指令後,屏幕上出現了0號智能體,就是小組長。它是整個智能體團隊的核心,負責規劃調度。它將這個任務拆解成了需求確定、內容生產、工程開發三個步驟。並且告訴我,它會召喚各個智能體來協作完成任務。

首先召喚的是1號智能體,是策劃智能體,負責活動邀請函的策劃、設計解決方案。那1號智能體又將這個任務拆分成:核心需求、內容結構、開發需求、數據收集四個子任務。

接下來,2號智能體就被召喚出來了,即小編智能體,它的主要職責是編輯邀請函中的所有文字和媒體內容。邀請函需要在正文裡包含一段發佈展望,這個智能體通過全網搜索和總結,寫出了一段關於蘿蔔快跑的精彩描述。它自動閱讀上傳文件後把時間地點等核心信息提取出來放到了合適的位置上。對於封面圖,我提出新的需求,給智能體幾張蘿蔔快跑六代車的照片,讓它生成一個充滿科技感的圖片作爲邀請函封面。我們看到智能體通過iRAG的能力,成功繪製出了一張帶有RT6的封面圖。

然後,3號智能體出場,它是程序員智能體,負責寫代碼,來製作和部署網頁。大家看屏幕上,就是智能體在自動寫代碼,。但你完全不需要看懂這一側的東西,你只要看得懂那邊人話就行了。

等它寫完後,4號智能體質檢員出場了,它發現了一個bug,所以把程序員智能體再叫回來,重新寫、重新改代碼。可以看到,質檢員智能體會利用反思能力,運行測試代碼,看看代碼是不是跑得通。

現在智能體已經把代碼修復好了,自動生成了邀請函,但我覺得這個畫風不夠好看,想再換一個更有科技感的。輸入這個想法後,程序員智能體會再寫一次代碼,給出一個新版本,這次換成了一個更有科技感的色調,有邀請函、會議日程,最後還附上了參會報名的界面,通過調用地圖的API,嘉賓就可以一鍵導航到達會場。我們輸入個測試信息。

最後,可以在後臺看到,這條報名信息已經在統計表格中了。

這樣一個發佈會的邀請系統,從你開始到最後結束,只需要3分鐘,用戶不用寫一行代碼,就可以完成。

整個過程體現了 整個過程體現了秒噠的三個特性:第一是無代碼編程、第二是第三是多智能體協作、多工具調用。無代碼編程,是由大模型直接生成代碼,不需要人寫一行代碼,所以門檻就大大降低了,每個人都可以去做,每個人都可上手;多智能體協作,是基於文心大模型思考、規劃等能力,實現對不同類型智能體的調度、編排,這個任務中一共有5個智能體協作完成;多工具的調用,剛纔這個例子當中,調用三個工具,一個是網頁檢索工具,他要到網上去找RT6各種各樣的資料來進行創作;一個是iRAG,就是圖片的檢索生成,我們給了RT6圖片之後,可以保持原來的精準度,生成相應的圖片;還有地圖的API調用。

有了秒噠,一個人通過自然語言交互,就可以完成一整套系統的搭建。

除了上面展示的邀請系統,秒噠還可以做任意場景下的各種應用,應用的複雜度也會隨着我們技術的提升不斷提升。最早開始的時候,它只能做一些比較簡單的編程,比如說兩三百行代碼,以後隨着基礎模型能力提升,以及秒噠本身技術能力的演進,它就可以做越來越多的,越來越複雜的事情。這意味着什麼?這意味着,你不需要去招募項目經理、設計人員、開發人員、測試人員等等,自己就可以指揮多個智能體來協同完成任務。也就是說,只要有想法,你就可以心想事成,我們將迎來一個前所未有的只靠想法就能賺錢的時代。以前有個想法,你還要去執行,把想法做出來。現在只要你有想法,秒噠就可以幫你做了。

我想,AI之所以被稱爲產業革命級的機會,就是因爲它對於社會經濟,帶來了生產力的無限擴張。 秒噠讓每一個人都能具備程序員的能力,會說話就能做出應用來,它對於人類工作效率的提升怎麼說都不爲過。現在你就可以去排隊預約,我們明年第一季度發佈秒噠,大家就可以試用了。

今天,我們用大約一個小時的時間,回顧了過去24個月,全球生成式AI變革帶來的應用大爆發,也發佈了文心iRAG和無代碼秒噠兩大技術,展示了智能體、產業應用兩大應用方向的案例。可以看出,AI應用的時代是真的來了!

當然,在人類信息技術變革的不同歷史時期,應用出現的的樣貌也不一樣:在PC時期,它是一個個的軟件和網站;在移動時期,它是一個個的APP和被關注的賬號;在AI時代,應用最主要的形態就是智能體。隨着大模型技術和能力的指數級躍遷,自然語言成爲了這個時代最重要的編程語言。我們每一個人都能動手創造一個屬於自己、也屬於他人的AI應用,或者智能體。

我是軟件工程師出身,國外有一種說法叫“軟件吞噬世界”。但我認爲,這個世界不應該被吞噬,而應該被創造。AI時代,應用創造世界。所以請大家和我一起見證,AI applications creating the world.

謝謝大家。