大模型:從拼性能到拼賦能

(原標題:大模型:從拼性能到拼賦能)

在過去的兩年中,以大模型爲代表的通用人工智能開啓了一個全新的時代。

從“百模大戰”到“千模競技”,各種文生文、文生圖、圖生視頻、文生視頻甚至多模態大模型層出不窮。

在經歷了最初的繁榮生長後,行業發展逐漸進入理性期。落地應用,成爲企業最基本的目標。

10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節在合肥開幕。

從拼性能到拼賦能。在尋找產業化發展的道路上,整個行業吹響了應用的“衝鋒號”。

這也是今年的訊飛1024開發者節帶給人們的最突出“觀感”。

在這場盛會上,諸多基於AI大模型的應用產品得以發佈展示,顯示出星火大模型在教育、醫療、能源、汽車、工業、金融、法律等領域不斷拓展的潛力。

而從普通市民角度來看,一場城市的“AI嘉年華”,又讓人們直觀感受到大模型正切入人們生活的方方面面,迎來規模化應用落地的新時代。

以技術創新爲底座,解放生產力,釋放想象力。

大模型將如何收穫“產業果實”,賦能千行百業?

“超擬人”

在大會開幕式上,科大訊飛董事長劉慶峰首先公佈了訊飛星火大模型應用成績單,並正式發佈訊飛星火4.0 Turbo。

與此同時,國產超大規模智算平臺“飛星二號”正式啓動。

大模型技術底座能力,是產業化應用最堅實的底氣。但另一個層面,大模型狂飆2年,已經過了不斷比拼技術數據的階段,更多的是要從需求出發去做技術提升。

“萬物智聯”是未來社會的典型特徵。劉慶峰說,在萬物智能時代,不僅是語音,整個人機交互領域都將上一個全新的臺階。

科大訊飛定義了萬物智能時代的人機交互(AIUI)標準,並且通過了國際組織的認定,已經在去年5月正式發佈了國際標準,包括遠場高噪、全雙工、多語種多方言等多個方面,此次1024開發者節,標準再次升級,新增了多模態、超擬人、個性化。

多模態是指多種視覺、聽覺等感官信息在一起協同作用的狀態。開幕式上,科大訊飛超擬人數字人首次亮相。多模態的交互從超擬人的語音變成超擬人的數字人,實現語音、視頻、圖文的全部聯動的多模態交互。

多模態視覺能力加持下的人機交互有多驚喜?

超擬人數字人不僅可以“角色扮演”,還能夠模仿孫悟空、蠟筆小新、小豬佩奇等多種角色,音色、語氣甚至人設都模仿得惟妙惟肖。

“原來是給一張照片就可以有嘴型;今天,我們把嘴型、表情、動作全部貫穿起來,所有的表情動作整體化地用我們的大模型技術自動生成,而且實現了表情動作的語義貫穿,統一文本、語音和表情,實現跨模態的語義的一致性。”劉慶峰解釋道。

從語音交互拓展到音視頻流的實時多模態互動,情境感知更全面。不光有語音,場景、文字、物體、姿態、着裝都可以看到,任務理解就會更精準;因爲有語音、有手勢、有行爲,還有情緒,就可以使遊戲、學習、購物、美食、知識問答、繪本伴讀更有趣;在具身智能機器人以及汽車等新終端越來越多的未來,可以實現全新的人機交互的升級,做很多原來做不成的事。

值得一提的是,科大訊飛還首次發佈星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種。

“武裝”6000萬輛汽車

“今天,大模型已經進入到關鍵應用落地、更復雜的深水區。”在開幕式上,劉慶峰感嘆。

大模型發展到今天,靠繼續提升通用大模型性能,能帶來的行業進步十分有限。要想摘到“產業果實”,必須紮根產業場景。

汽車是大模型應用探索的絕佳載體。新能源汽車產業是安徽近年來發展最受矚目的產業。AI上車不僅將提升駕駛的便捷性與智能性,更可重新定義人與車的關係,開啓汽車智能化的新時代。

大會開幕式上,奇瑞控股集團有限公司黨委書記董事長、總經理尹同躍也來到現場。奇瑞、江淮汽車等車企也都攜多款明星產品亮相展會。這些產品均應用了科大訊飛的核心技術。

“目前,我們智能語音交互的裝配量已經超過了6000萬輛車。去年,中國汽車出海500多萬輛,多語種技術幾乎都由科大訊飛提供。”劉慶峰表示。

“用人工智能技術解決社會剛需”,是科大訊飛一直以來的出發點之一。此次1024科大訊飛全球開發者節上,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發佈了最新的產品應用。

在教育行業,首次發佈了基於“問題鏈”的高中數學智能教師系統。在醫療行業,發佈訊飛星火醫療大模型2.0和基於訊飛星火醫學影像大模型打造的智能醫學影像助手。在政務服務場景,政務大模型持續迭代,全面覆蓋4500多種標準化事項和60多種材料。

中國工業和信息化部賽迪研究院數據顯示,2023年,中國生成式人工智能的企業採用率已達15%,市場規模約爲14.4萬億元。截至2024年10月,科大訊飛已與各頭部企業共建20多個行業大模型,覆蓋300多個應用場景,均爲第一。今年1月至9月,大模型市場中標金額和中標數,科大訊飛也均是第一。

“大模型+大算力+大數據+大場景”

在安徽,一個以大模型爲根基的產業森林正在生長。

十多年前,安徽依託中國聲谷打造了合肥市智能語音集羣,成爲目前安徽唯一國家先進製造業集羣。

如今,在新一輪科技革命和產業變革下,安徽正搶抓通用人工智能發展戰略機遇,致力打造產業新高地。

以“聲谷、視谷、傳感谷”等品牌爲引領,2023年,安徽全省559家納統人工智能規上企業實現營收1327.7億元。今年1月至6月,全省783家納統人工智能規上企業營業收入同比增長9.1%,高於全省新興產業平均水平0.6個百分點;人工智能產業投資同比增長30.7%,高19.7個百分點。

賽迪顧問報告顯示,2023年全國31個省(自治區、直轄市)人工智能產業發展評價中,安徽排名第6位,其中產業未來潛力、企業成長潛力分別居第1位、第2位。

只有生態的繁榮,纔有人工智能的大未來。

安徽省工信廳相關負責人表示,世界聲博會暨科大訊飛全球1024開發者節亦是推動安徽省智能語音及人工智能產業發展的重要平臺,對於安徽構建“大模型+大算力+大數據+大場景”的產業發展格局具有重要促進作用。

本屆聲博會系列活動中,還包括了2024科大訊飛AI開發者大賽。共有來自14個國家、348座城市的35268支團隊參賽。科大訊飛聯合30所科研院校、44家企業與機構共創賽題,最終評選出十佳團隊。

這些團隊都將成爲安徽乃至全國人工智能產業不斷生髮的“種子”。

科大訊飛將牽頭成立AI基金,用5億元創業基金推動開發者創業,加速前沿技術產業化進程,並與地方政府聯合爲AI創業團隊提供產業落地支撐。

今年9月,作爲安徽省重點打造的集科研、教育、產業化於一體的AI產業集聚區——訊飛小鎮,正式投入使用,爲安徽人工智能科技創新和產業發展提供了重要載體。

發佈會上,科大訊飛、華爲、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啓動。

科大訊飛表示,將開放全場景資源,進行線上線下渠道和資源共享,讓更多開發者在拓展市場上取得更大成功。

一個頂天立地、自主可控、通專結合、端雲聯動、軟硬一體的人工智能發展生態正在安徽不斷匯聚。(記者 豐 靜 通訊員 汪日貴)