科大訊飛昇級星火大模型,持續推動AI大模型產業化應用 | 最前線
文 | 王方玉
編輯 | 蘇建勳
有“通用大模型國家隊”之稱的科大訊飛,再次升級大模型能力。
10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節開幕式上,科大訊飛董事長劉慶峰發佈了訊飛星火4.0 Turbo。
劉慶峰介紹稱,訊飛星火4.0 Turbo全新升級,根據鮮活的真實數據背靠背測試,七大能力全面超過GPT-4 Turbo,數學能力、代碼能力超過GPT-4o,國內外中英文14項主流測試集中實現9項第一。
發佈會現場,科大訊飛還展示了大模型在多模態交互能力上的進展。據瞭解,在原有的遠場高噪、全雙工、多語種多方言能力上,此次升級了多模態能力,新增了超擬人和個性化能力,實現了語音、視頻、圖文全部聯動的多模態交互。
算力方面,科大訊飛一直堅持基於國產算力打造自主可控通用大模型底座。去年10月,科大訊飛曾聯合華爲推出首個國產萬卡規模大模型算力平臺“飛星一號”。
本次發佈會上,科大訊飛、華爲、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”也正式啓動。劉慶峰表示,此次啓動升級版的“飛星二號”,將帶來新模型新算法的持續適配和智算集羣規模的再次躍遷,引領國產大模型底座的發展、給世界提供第二選擇。
今年以來,有一批大模型公司停下了預訓練的腳步。預訓練模型是大模型公司的底層核心技術,停了通常意味着走下了牌桌。通過升級星火模型和啓動新智算平臺,科大訊飛傳達了持續預訓練的態度和信心。
科大訊飛研究院院長劉聰在接受36氪採訪時表示,訊飛的大語言模型會堅持迭代,在類似於o1大模型、多模態交互、語音端到端等方面持續佈局。
劉聰坦言,訊飛的算力規模不及頭部大廠;使用國產算力平臺,也需要花費不少額外精力進行適配等工作,但訊飛堅持基於國產算力打造和升級自主可控的通用底座大模型,在國內芯片和算力集羣相較於國外領先水平有一定差距的情況下,做出了可觀的效果。
據介紹,在過去一年多的實踐中,星火大模型在“飛星一號”上的訓練推理性能不斷優化,部分測試集表現甚至超過國際領先的GPT-4 Turbo。
在大模型產業化應用方面,科大訊飛一直推進積極,致力於“用人工智能技術解決社會剛需”。公開信息顯示,今年1-9月,科大訊飛成功中標38個項目,披露的中標金額爲2.16億元,項目數量和金額,均在行業內排名首位。
“未來AI技術的探索,必須大規模產業化,必須在場景中進入到真正的深水區,所有玩‘概念’的都不會有大未來。”劉慶峰在演講中表示。
發佈會上,基於訊飛星火底座能力,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發佈了最新的產品應用。據悉,截至2024年10月,科大訊飛已與各頭部企業共建20多個行業大模型,覆蓋了300+應用場景。