聚焦WAIC丨垂直大模型的行業落地:是趨勢,也需破局

21世紀經濟報道記者 董靜怡 上海報道

“過去談概念,現在更多談怎麼落地。”7月6日,安永數據智能諮詢服務合夥人陳劍光在2024世界人工智能大會的“知識改變世界——垂直大模型重新定義知識管理”的主題論壇上表示。

真正的落地,更多是靠垂直模型。現場嘉賓普遍反映,大模型在垂直行業中的落地已經從最初侷限在特定行業拓展到各行各業。

不過,我國垂直大模型在企業場景中的應用尚處於探索階段,市場上的大模型解決方案存在同質性問題,缺乏針對不同行業特點和需求的定製化服務,這在一定程度上限制了大模型的創新性和應用效果,許多企業仍在尋求大模型的最佳落地方案。

高質量的垂直行業訓練數據缺乏,也成爲制約大模型訓練效果和應用性能的關鍵因素。

達觀數據董事長兼CEO陳運文在接受21世紀經濟報道記者採訪時表示,雖然各行各業擁抱AI的態度比較積極,很多企業仍面臨數據缺乏和數據基座沒有打好的問題,尤其是中小企業。

垂直大模型的發展和應用,是一個複雜而多維的過程。它不僅需要技術的創新和突破,更需要對行業的深刻理解和知識的有效整合。

垂直模型的落地之困

垂直大模型是專門針對特定行業或領域開發的人工智能模型,它們結合了行業知識和場景化處理能力,以實現更精準和高效的知識管理與應用。

以達觀爲例,達觀垂直大模型是“混合模型+垂直知識+場景應用”,它兼容了多種基座模型。

目前,垂直大模型在金融、檔案管理、法律審查等領域有所應用。例如,國泰君安證券利用大模型提供智能投顧服務,上海市檔案館使用大模型進行檔案的數字化和智能化管理。

不過,整體來看,大模型在各行業的應用場景和範式還相對有限,一方面,大模型目前主要應用於一些常見的場景,如文本分類、情感分析、機器翻譯等,而在一些特定的業務場景或新興領域中的應用還不夠廣泛。

另一方面,市場上的大模型解決方案存在較高的同質性,缺乏針對不同行業特點和需求的定製化服務,導致應用效果和創新性不足。

如何更貼近行業?高質量的訓練數據是一大問題,缺乏足夠豐富和高質量的垂直行業訓練數據,限制了大模型的訓練效果和應用性能。

“垂類模型更多關注細分行業專有數據,既包括與個人相關的用戶數據,還包括企業資產行業數據。”中科曙光智能計算產品事業部副總經理胡曉東表示。

但這些數據並不容易獲得。在一些細分行業中,例如工業領域,獲取數據相對困難,不僅數據量較少,而且往往很難在企業之間共享。

中小企業更是一片數據窪地。陳運文向記者表示,許多中小型企業在過去缺乏統一的文檔資料管理系統,這些企業的文檔資料通常分散在員工的個人電腦中,難以進行大模型的賦能。

“首要目標是建立一個集中的文檔管理庫,將所有員工的文檔資料集中存儲。在此基礎上,可以構建大型模型和上層的智能化應用系統。”陳運文向記者表示,“這是一個逐步的過程,首先需要打好基礎。”

下一步則是知識的深度挖掘。陳運文向記者表示,如果垂直模型與專業知識的結合僅限於表面層次,這是不充分的。只有當這種結合達到深層次時,垂直模型才具有真正的價值。行業知識的深度挖掘能夠帶來更深遠的意義和應用潛力。

這時候仍需要人的力量實現對模型的微調。“要人類專家來傳授經驗,大模型要做定向的修改去吸收這些經驗,最後開發出針對性的產品。”陳運文表示。

亟需產業鏈合作參與

如何進一步提升行業模型的能力?中國工程院院士、復旦大學金融科技研究院院長柴洪峰認爲,關鍵在於發現大模型在垂直行業中的涌現效應。

以金融行業爲例,他認爲,可以打造金融數據基座,構建一個廣泛的數據基礎,爲大模型提供充足的訓練材料,以提高模型在金融等垂直領域的應用效能。這也符合涌現效應突破需要的大數據、大參數和大計算尺度的要求。

但並不是完全依靠“大力出奇跡”。“既依靠‘大力出奇跡’的規律,又要用該規律在不同領域,用不同的算法來產生這種協同。”柴洪峰表示。

此外,柴洪峰提出了大模型在工程落地中的創新可能。他表示,將大模型與知識圖譜結合,知識圖譜提供可預期和可信的決策支持,這是“對外服務”;大模型則產生“幻覺”,即發現專家可能未意識到的新知識或洞見,通過不斷的迭代優化,可以轉化爲新的知識圖譜,從而擴展現有的知識體系,這是“對內發現”。

“可以用上述方式進行集成創新,實現知識的對外服務和對內發現的結合。”柴洪峰表示,由此進一步促進知識生產力的提升。

最後,他提出了合作的重要性,“通過軟硬一體、供需統籌、產學研協同,創新管理合作模式,實現人才密度、科研強度、創新速度的有效集成,推動金融大模型技術的研發與應用,加速行業智能化和數字化轉型。”柴洪峰表示。

而在實際應用中,上下游的聯動、各行各業的跨界合作已經變得非常普遍。大模型的出現導致了人工智能價值鏈的重塑,意味着價值鏈上的各個環節正在重新定義它們的角色和貢獻,明確了生態系統中每個部分應該提供的價值,例如數據的收集、模型的訓練、應用的開發等。

百川智能副總裁鄧江在圓桌論壇上感嘆,過去接觸的行業相對有限,主要是金融等少數幾個行業,然而隨着大模型的興起,目前已經與來自各行各業的優秀企業和合作夥伴建立聯繫。

“不跨界合作很難贏。因爲生產裡面的各種角色都掌握了局部信息、片段信息,或者他擁有局部的優勢。如果這個優勢分散,產生不了最大的價值。”復旦大學金融科技研究院常務副院長、計算機科學技術學院副院長吳傑表示。

這也重塑了每個參與者的思維,即需要有全局視角。鄧江表示,在基礎研發中,除了提升模型的能力外,還需要考慮不同行業的需求和實際情況,將這些能力應用到實際的產業鏈中,以實現更高效的運作。

“最終要選擇好在哪個產業鏈上作爲優先突破的方向,讓模型首先適配該產業鏈上所有生態夥伴的需求,這是大家要去思考的一個很重要問題。”鄧江表示。

如今,生態系統中的各個部分,變得更加緊密地聯繫在一起,形成了一種推動整個行業發展的力量。通過開放合作和深入研究,解決複雜問題,並克服應用落地的最後障礙。