智譜交出AI Agent最新答卷
作者 | 劉寶丹
編輯 | 黃昱
距離ChatGPT橫空出世已有兩年,AI大模型技術迎來了新的發展階段,AI Agent成爲行業競爭的新焦點,國內AI獨角獸智譜也率先披露了Agent技術方面的佈局。
11月29日,在智譜Agent OpenDay上,公司CEO張鵬發佈了AutoGLM升級版。這一版本不僅能夠執行超過50步的複雜操作流程,跨越不同應用程序執行任務,還能支持長任務的自定義短語,並具備主動決策的能力。
此外,智譜AI還推出了基於PC的自主Agent——GLM-PC,它的定位是成爲一個全面的桌面助手,目前涵蓋會議替身、文檔處理、網頁搜索與總結等功能。
此次升級標誌着,智譜AI在語言交互的基礎上,進一步推動大模型技術向更復雜的物理世界交互邁進。
智譜創立於2019年,由清華大學計算機系知識工程實驗室的技術成果轉化而來,是“AI六小虎”中成立最早的AI創業公司。在ChatGPT走紅的前兩年,智譜AI便已全力投入大模型技術的研發,目前已經成爲AI技術佈局最爲完備的公司之一。
AutoGLM能快速推出,也是得益於智譜的前瞻性技術佈局,包括智譜在大語言模型、多模態模型、邏輯推理和工具使用等方面的技術積累。
張鵬表示,從2023年4月的Agent Bench開始,到2023年8月的CogAgent模型,智譜針對AutoGLM,和GLM-PC的模型CogAgent的研發工作進行了一年半的時間。
對智譜而言,AutoGLM和GLM-PC是公司邁向AI智能操作系統的重要一步,更是通向AGI的必由之路。
與 GenAI 不同,Agent 是目標驅動型的,能夠完全執行工作流程,適應、學習、迭代、與其他系統和人類協作,並端到端的完成任務。張鵬認爲,Agent可以視爲大模型通用操作系統LLM-OS的雛形。
張鵬表示,“現階段,AutoGLM 相當於在人與應用之間添加一個執行的調度層,很大程度上改變人機的交互形式。更重要的是,我們看到了 LLM-OS 的可能,基於大模型智能能力,未來有機會實現原生的人機交互。將人機交互範式帶向新的階段。”
業內普遍認爲,2025 年將是 Agent 爆發之年。Gartner 近期將 agentic AI 列爲 2025 年十大技術趨勢之一,並預測 2028 年至少有 15% 的日常工作決策將由 agentic AI 自主完成,而這一數字在 2024 年爲 0。
業界領袖如黃仁勳、李彥宏、奧特曼等都公開表示看好其未來發展。黃仁勳認爲,AI Agents是人工智能發展的未來趨勢,世界各地都在競相採用人工智能來加速創新和提高生產力,很快,公司將有AI Agents和團隊一起工作。
根據 marketsandmarkets 的數據顯示,2019 年全球自主智能體市場份額爲 3.45 億美元,預計 2024 年將達到 29.92 億美元,其間 CAGR 爲 54%。該機構預測,2023年全球自主人工智能和自主智能體的市場規模在2028年能達到 285 億美元,其間CAGR 爲43%。
對智譜而言,提前佈局AI Agent贏得了寶貴的時間優勢,這對於一個處於快速技術迭代的行業來說至關重要。然而,AI Agent仍處於早期階段,智譜AI面臨的競爭壓力不容小覷。
張鵬坦言,目前大模型的能力距離真正代替人們辦公還有一定距離。未來,GLM團隊將繼續加速Agent模型產品的研發。
挑戰也顯而易見,全球巨頭們都開始加註AI Agent。6月,蘋果在開發者大會上展示了其最新的AI成果Apple Intelligence,Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業也已經將 Agent 作爲 2025 年的主要關注點。
下半年以來,投資人對AI大模型行業的投資熱情已經顯著下降,AI創業公司普遍面臨商業化方面的壓力。對此,張鵬表示,商業化固然重要,但並非唯一目標,智譜AI希望在技術投入和商業化之間找到平衡。
張鵬強調:“我們看待問題更多的是技術導向,是最終目的的導向,而不是僅侷限於單項技術的快速變現。我們最終是幫助大家切切實實解決生產力問題,而不僅僅是簡單的快速盈利。”
根據IT桔子數據,智譜成立以來累計完成10輪融資,目前估值爲260億元,僅今年,公司就經歷了4輪融資,背後的投資者既包括阿里、騰訊這樣的大廠,也包括紅杉、高瓴等資本機構,北京人工智能產業基金、清華控股、中關村科學城也是智譜的股東。
AutoGLM只是一個開始,在經過了5年多的技術沉澱後,智譜開始真正邁向大規模應用階段,雖然離用一句話操作電腦和手機的範式還有很遠距離,但探索之路已經開始了。