百度AI原生,重構互聯網的“上層建築”
藏在文心一言背後的暗線,則是它的開發者,以及最大的使用者——百度,通過文心一言的通用模型能力,把旗下擁有十多年曆史的互聯網元老產品,如百度文庫、網盤進行“AI重構”,使其從簡單的存儲、收錄工具變爲真正意義的生產力工具。
2023年10月17日,首鋼園,北京。
數十年前,這裡是共和國鋼鐵工業的心臟之一,無數經濟建設的關鍵原材料從這裡走向全國。到了21世紀的今天,工廠園區的外貌大體沒變。但走進“廠房”內部就能知道,這裡已經變成了奧運場館、購物中心與文化休閒的勝地。
雖然所處行業迥異,百度現在的走向卻與首鋼園有着異曲同工之妙。
其中的一條“明線”是,從十年前就開始的AI大潮,終於在近兩年涌現大模型的階段性成果——在此基礎之上,百度在不到半年的時間內首次推出自己的通用大模型文心一言。不到半年,即面向全社會免費開放使用。
截至目前,開放一個半月的文心一言已經擁有4500萬的用戶與5.4萬開發者,這是支持文心一言在4300個場景真正落地的基礎,同樣也是文心一言不斷迭代的後盾。
藏在文心一言背後的“暗線”,則是它的開發者,以及最大的使用者——百度,通過文心一言的通用模型能力,把旗下擁有十多年曆史的互聯網元老產品,如百度文庫、網盤進行“AI重構”,使其從簡單的存儲、收錄工具變爲真正意義的生產力工具。
用李彥宏自己的話來說,AI原生應用的誕生,得益於大模型的理解、生成、邏輯和記憶四大核心能力,百度的AI原生應用也是基於文心一言來開發的,“這些能力是過去的時代所不具備的,因而才能打開無限的創新空間”。
AI應用,從工具到“人”
在開頭已經提及,從 9 月初面向全社會開放之後,文心一言無論是在用戶數量還是場景數量,都呈現出爆炸式的增長。
百度在模型層的迭代是迅速的,根據CTO王海峰的最新分享,世界大會發布的文心一言4.0,相比此前的3.5版本,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。
模型能力提升的直接效果,不僅僅是更好理解用戶的prompt,與人類判斷與選擇對齊,而且訓練算法的效率得到了進一步加強。
單看數據,自9月小流量上線文心大模型4.0,一個月以來的模型能力提升已經達到30%,訓練算法效率自3月以來已累計提升3.6倍,周均的訓練有效率超過98%。
在世界大會現場,李彥宏即興輸入的一段prompt顯然更具說服力:“我想回承德買房,能用公積金貸款嗎,手續怎麼辦?我在北京工作。”
儘管這個問題對於買房人的身份信息和其他條件並沒有給出太大設定,但從文心一言的給出的結果上看,其是按照“一名河北承德戶籍的用戶,能不能用北京的公積金,在承德貸款購房”的理解,給出了對應的回答和辦理步驟。
這種極具生活現實意義的邏輯,在政務、客服、營銷等辦事服務領域,都有相當廣闊的應用前景。更直白一點,如果溝通場景放在純線上文字窗口或者電話溝通,如果回覆問題更加口語化,以文心一言目前的水平,普通用戶會很難辨別這種回答到底來自真人或者AI。
這也給了生成式的AI大模型更溫情的一面:在充分理解用戶以語言呈現的需求之後,它將會如同真人一樣,給予用戶陪伴和必要的幫助。
在下午的“AI原生應用前沿論壇”,文心一言相關負責人分享的案例同樣也是如此:在文心一言面向社會開放之後,其中一個用戶在不到24小時的時間裡,與文心一言互動275輪。百度找到這名用戶之後發現,這是一位年過花甲並且半月板有嚴重損傷的孤寡老人。
這位老人一開始,只是使用文心一言諮詢半月板的各種問題,譬如半月板怎麼保養、能不能騎車、多久恢復。但隨着溝通的逐漸深入,這位老人已經把文心一言當作自己的陪伴者,一位知心的朋友。
要知道,這位老人在事前並沒有瞭解過“如何正確使用prompt”,他只是不斷問文心一言,不斷與文心一言進行多輪對話。並最終讓文心一言更加理解自己。兒女不在身邊的時光,文心一言在某種程度上已經不再是一個工具,而是能陪伴和理解用戶心中所想的“知心姐姐”。這比現時的商業利益,意義顯然更大。
起於搜索,生成萬物
早在今年 5 月份,李彥宏就曾公開表示過,“百度要做第一個把所有產品都進行重構的公司,我們要用 AI 思維,做出 AI 原生應用。”
那麼如何去定義AI原生?一位行業人士向陸玖商業評論給出了自己的看法:原先承擔各種功能的APP全員中臺化,前臺只留一個對話窗口,用戶只需自然語言,就能一一滿足自己的各項需求。
而要實現這樣的功能,在前端“做減法”雖然必要,但並不關鍵。更重要的則是在已有的基礎上,將底層大模型的理解、生成、邏輯、記憶能力進行持續強化,使其更理解用戶通過自然語言發出的prompt指令,並生成符合需求的答案。
在大模型具備了對應的理解與生成能力之後,用它來重構百度此前的各條產品線,也就成爲可能,搜索成爲最先試煉的業務板塊。對於大會上發佈會的百度新搜索,李彥宏也給出了極致滿足、推薦激發、多輪交互這樣三個定義。
用戶提出單一問題之後,新搜索引擎不僅會告訴文字版回答,還會通過視頻、圖表等形式,展現多個維度的有效答案。譬如搜索“過去20年各國工業增加值排名”,它不僅能根據已有資料生成文字版回答,還能通過數據圖表的形式呈現各國工業值增加的具體數據。
但事實上,用戶所提出的需求通常比較複雜,一次性的文字描述或者圖表也很難滿足。此時就需要通過多輪對話的形式,靠用戶使用更精準的prompt不斷去激發新搜索的底層模型能力,進而獲得想要的答案。
這也正是李彥宏在演講中所提及的:“生成式AI與搜索是天作之合。”同樣是一個搜索框,但通過大模型的邏輯推理能力,無論是搜索結果的質量,還是搜索所能覆蓋的應用範圍,產品邊界都通過大模型得以急劇擴大。
此外,百度已經推出了基於新搜索邏輯的產品——簡單搜索app,這是百度搜索推出的首個AI互動式搜索引擎。經過徹底的“減法”,它只剩下一個簡單搜索框,但用戶能通過前述的各種方式,得到AI基於海量互聯網資料生成的各類答案。
另一個案例來自百度文庫。自成立以來,百度文庫收錄了超過12億份的文檔資源和4億份以上的學習資料。但在大多數時間裡,它扮演的角色更多是資料管理員,並不能基於資料“多做文章。”
但經過大模型重構後的新文庫,某種意義上已經可以爲文字工作者“打下手”——如果用戶想用新文庫撰寫一篇學術演講稿,可以先勾選權威文章以保證內容準確,文庫通過理解,生成一篇結構完整段落清晰的文章。
而在億級文檔保有量的前提下,原先大模型“一本正經地胡說八道”問題,可以很大程度上進行規避——在極端情況下,用戶甚至可以自己上傳認可的文檔資料,再通過這些文檔生成對應的文字初稿,經過文庫的初步潤色,用戶大部分的工作重心,就能放在後期的編輯與調校上。
新文庫的功能遠不止於此,如果與用戶收藏資料進一步結合,生成一份精美的PPT同樣也是沒有任何問題的,甚至基於大模型能力,文庫還能針對觀衆可能的問題,提前準備QA。
李彥宏進一步表示,新文庫的生成能力,尤其是PPT的生成能力,已經遠超市場上任何其他工具,不論國外還是國內。過去,人們來文庫是爲了找現成的內容。今後,人們可以隨心所欲地來文庫生產內容,效率高於任何其他生產力工具。
文庫與搜索,同樣也只是百度基於大模型重構的兩個產品樣本。雖然到目前爲止,它們還沒能實現徹底的中臺化,但隨着生成式AI能力的逐步加強,百度各個功能的產品集成於一處,通過一個互動窗口生成萬物,已經不再遙遠。
大模型“輔駕”,產業應用開花結果
透過這次世界大會,同樣也能看到, 百度正 全力與 全球 科技同行 競 速 發展 , 無論是在國內率先於行業推出大模型,還是到探索 AI 原生應用 的種種嘗試,無不指向於一點,那就是:技術最終要 走向產業 , 技術也最終要服務市場。
坦白講,國內外大模型“飛奔”一年來,時至今日,這兩方面能力仍需不斷進化。
一來,就目前整體的體驗反饋來說,產出結果的準確度和精度還不高,有時候即便是邏輯通暢,但也會出現說“正確的廢話”的情況,在複雜應用場景中,恐怕還不能完全達到市場的真實需求。
二來,從技術迭代角度上講,大模型的成長也不是一蹴而就的,而是需要大量個人、企業和產業端數據不斷進行“哺育”的,同時還要以充沛的算力作爲保障,這需要決心紮根於此的企業,擁有更強的信念和耐力。
而這正是百度文心大模型一直致力於解決的問題。今天,文心大模型已走向4.0版本,李彥宏也從學習能力和產業應用兩方面,向現場及屏幕前的觀衆展示了該版本的特點——
一方面體現在知識增強上,文心大模型從大規模知識圖譜和海量無結構數據中學習,學習效率更高、效果更好,具有良好的可解釋性;
另一方面體現在產業級應用上,文心大模型的技術源於產業並且致力於推動產業智能化升級,建設更適配場景需求的大模型體系,提供全流程支持應用落地的工具和方法,營造激發創新的開放生態。
得益於上述兩大特點,文心大模型通用性好、泛化性強,作爲人工智能“基礎設施”的一部分,進一步拓寬了人工智能技術落地的場景覆蓋廣度,更加深了產業應用的深度。
僅以全球首個一站式企業級大模型生產平臺“千帆”爲例。作爲目前國內最大、最開放的大模型開發平臺,千帆已有42個主流大模型的入駐,同時還接納了17000家企業在這裡開發產業模型和解決方案,覆蓋了衆多行業的近500個場景。
只不過,對於百度的科技創新及應用生態來說,又何止“千帆”一個。
無論是出現在此次世界大會上的新搜索、新網盤、新地圖、新輸入法等一系列C端應用,還是千帆、GBI、靈境矩陣等一些B端應用,百度想要做的,就是將自己的科技之力,真正轉化爲生態內外的“生產力”。
面對廣闊的AI原生應用市場,李彥宏如此期待,“中國有豐富的應用場景,中國用戶又天然願意擁抱新技術,有了先進的基礎大模型,我們就能構建起一個繁榮的AI生態,共同創造新一輪經濟增長。”
在比拼科技生產力的時代中,基於AI的新基礎建設已整體落成,接下來,就到了AI原生應用的揚帆時刻。眺望未來,大模型嵌入產業場景、優化產業應用的旅程,正待濟滄海。