21 深度丨量化巨頭幻方攪局AI大模型:首期投入自有資金30億元

21世紀經濟報道記者李域 深圳報道

量化私募巨頭幻方成爲了AI大模型市場中的“鮎魚”。

7月4日,AI公司深度求索(DeepSeek)發文稱,DeepSeek API已經上線128K上下文長度,價格保持不變,還在大家熟悉的,即“每百萬tokens輸入1元、輸出2元”。

兩個月之前,在5月6日,DeepSeek發佈DeepSeek-V2,其API的定價爲,每百萬tokens輸入1元、輸出2元(32K上下文),價格爲GPT-4-Turbo的近百分之一。

價格戰的第一張多米諾骨牌倒下後,字節、阿里、科大訊飛、騰訊等紛紛跟進,宣佈了降價策略。國內大模型廠商,迎來對B端和C端的全面降價甚至免費。

公開資料顯示,深度求索成立於2023年7月,由知名量化資管巨頭幻方創立,其推出的DeepSeek-V2在衆多開源模型中將價格“卷”到了業內最低,被AI圈稱作“價格屠夫”。

在量化交易備受爭議的當下,幻方量化發力探索 AGI(人工通用智能),令市場不禁疑惑,公司是否是因市場變化,縮減資管業務,進行戰略調整?

“幻方還是那個幻方,DeepSeek是DeepSeek。”7月17日,幻方量化的創始合夥人徐進對21世紀經濟報道記者表示,量化交易是幻方過去以及以後的核心業務。

據悉,依託幻方的資金、技術和硬件設備,深度求索第一期研發投入爲幻方自主出資30億元,同時有 “螢火超算”萬卡級別的算力支持。

AI圈 “價格屠夫”

AI大模型價格戰打響。5月初,DeepSeek宣佈開源第二代MoE大模型DeepSeek-V2。DeepSeek-V2沒有沿用主流的“類LLaMA的Dense結構”和“類Mistral的Sparse結構”,而是對模型框架進行了全方位的創新,提出MLA(Multi-head Latent Attention)架構,大幅減少計算量和推理顯存;自研Sparse結構DeepSeekMoE進一步將計算量降低到極致,兩者結合最終實現模型性能跨級別的提升。

據介紹,該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的僅百分之一。

其API的定價爲,每百萬tokens輸入1元、輸出2元(32K上下文)。作爲對比,GPT-4 Turbo每百萬tokens的輸入、輸出價格,分別爲72元、217元。

此後,智譜AI、火山引擎、阿里雲、百度、騰訊等都宣佈了降價策略。

智譜AI最先出招,2024年5月11日,智譜AI宣佈入門級大模型GLM-3-Turbo(上下文長度128k)的價格從0.005元/千tokens降低到0.001元/千tokens,降幅高達80%。

字節跳動也加入戰局。5月15日,字節跳動在火山引擎原動力大會上宣佈,豆包主力模型(小於等於32K)在企業市場的定價爲0.0008元/千Tokens,號稱比行業價格便宜99.3%。128k的豆包通用模型定價爲0.005元/千Tokens,號稱比行業價格低95.8%。

據瞭解,市場對字節跳動的這一降價策略反應熱烈,中小企業和個人開發者紛紛涌入。

5月21日,阿里雲的通義千問大模型加入了這場降價風暴,宣佈其GPT-4級主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達到97%。

面對各方的出擊,百度則直接祭出大招。5月21日,百度宣佈,文心大模型兩大主力模型ERNIE Speed和ERNIE Lite全面免費,立即生效。

德邦證券分析師陳涵泊表示,在應用開發階段,模型的使用成本是開發者和企業的重要考量因素,價格的降低有利於吸引更多的開發者和企業的入局,或加速AIGC應用的開發節奏與商業化成型;在應用推廣階段,價格走低將大幅降低應用的推理成本與用戶的使用門檻,促使AIGC應用規模化推廣與普惠化落地。

銀河證券分析師吳硯靖也持有相同觀點,在她看來,大模型圈價格戰進入白熱化階段,推理成本的下降將持續推動AI應用加速落地。

AGI探索之路

深度求索引發關注的同時,市場將目光投向背後的量化巨頭幻方量化。創立於2015年的幻方量化,是藉助AI等技術手段進行投資的對衝基金,當前管理規模逾100億。幻方旗下的浙江九章資產管理有限公司和寧波幻方量化投資管理合夥企業(有限合夥)均是在基金業協會備案的證券類私募機構。

據記者瞭解,國內第一批晉升百億規模的量化私募機構中,有多名有着華爾街巨頭千禧年基金任職背景的管理人,包括九坤投資的王琛、明汯投資的裘慧明等。

深圳百億量化私募誠奇資產的創始人何文奇,也曾任職於這家華爾街巨頭機構。

而幻方量化是爲數不多的量化“本土派”的代表,創始合夥人之一徐進是浙江大學信號與信息處理博士,曾任職於華爲技術有限公司上海研究所,現任寧波幻方量化投資管理合夥企業(有限合夥)執行事務合夥人、浙江九章資產管理有限公司法定代表人,目前兩家幻方量化實際控制人均爲樑文鋒。

2019年,私募的量化策略產品發行火熱,引發市場關注,幻方也同時出現在佳力圖等20餘家上市公司的十大流通股東名單中,這段時期還一度出現產品備案速度抵不過客戶打款速度的現象,此時,幻方量化已晉升百億量化私募之列。

同年,致力於 AI 的算法與基礎應用研究幻方 AI(幻方人工智能基礎研究有限公司)註冊成立。AI 軟硬件研發團隊自研幻方“螢火一號”AI 集羣。

2020年開始,幻方累計投資超億元、佔地面積相當於一個籃球場的AI超級計算機“螢火一號”正式投入運作,號稱可以匹敵4萬臺個人電腦的超級算力。

此後,“螢火二號”的投入增加到10億元,算力約爲“螢火一號”的18倍,搭載了約1萬張英偉達A100顯卡。

按此前媒體報道,目前持有量超過1萬枚GPU的中國企業不超過5家,即使規模最大的企業也不超萬枚。

在AI超級計算機的加持之下,幻方管理規模持續上升,曾一度突破千億大關。

有論文稱,ChatGPT能有效判斷文本情感傾向,且經過微調後的大語言模型能有效助力量化投資, 爲投資者帶來超額收益。

“未來AI 大模型可以助力量化投資,但是現在還用不上。”上海某頭部量化人士指出,主要還是數據不夠,特別是高質量的數據不夠,“數據量不夠模型還非常複雜,可能導致高方差或過擬合”。

幻方量化多位人士也在不同場合重申,AGI不是用來炒股的,有着更多的用處和價值。幻方量化創始人樑文鋒也曾在接受媒體採訪時表示,公司不會過早地設計基於模型的一些應用,而是會專注在大模型上。幻方的目標是探索 AGI,語言大模型可能是通往AGI的必經之路,並且初步具備了AGI的特徵,所以會從大模型開始。

量化交易是核心業務

即便跨界到了AI,量化交易依舊是幻方過去以及以後的核心業務。

私募排排網數據顯示,截至2023年12月31日,有業績展示的85家百億私募2023年度收益均值爲-0.77%。百億量化私募表現搶眼,2023年逆勢實現正收益。有業績展示的32家百億量化私募2023年度整體收益爲6.43%,其中31家實現正收益。

其中,九章資產和寧波幻方量化均實現正收益,分別爲4.86%和3.71%。

不過,在2024年上半年,幻方量化也遭遇了業績回撤。一份頭部券商重點私募業績數據顯示,截至2024年6月28日,量化機構的核心即策略中證500指數增強策略中,幻方500年內收益爲-8.96%。具體來看,該策略1月和2月的收益分別爲-3.76% 和-9.24%。

幻方在其產品運作說明中稱,幻方產品超額回撤較大主要原因是面對不同環境策略應對不理想,在面對短期極端市場未表現出較好的適應性,基於全市場選股構造的投資組合與指數差距較大,形成了明顯的超額回撤。回撤暴露出策略在因子迭代、風控管理等方面尚需優化。

爲此,幻方在今年2月初已收緊了整體風控,防止小市值股票出現極端流動性危機時對於投資組合的衝擊,並在每個交易日分析模型表現,持續進行優化,相信市場會逐步回到正常的軌道,策略模型也會恢復正常。

“量化投資,是依託海量數據和科學的模型,去做出勝率更高的投資預判。”深圳某私募人士表示,主觀和量化沒有孰優孰劣,任何策略都有周期性,市場上沒有常勝將軍,量化投資想要長期穩健的投資收益需要管理人強大的策略升級迭代的能力,這離不開管理人對更高的算力、更精細化的模型和更強的投研團隊的投入。

對於當前市場上的一些爭議,包括有觀點認爲“市場高開低走,是量化高拋低吸;市場上漲或下跌,則是量化追漲殺跌”等,7月17日,幻方量化發佈公告稱,這存在很大誤解。幻方量化表示,目前A股的市場有效性已經比較高,短線追漲殺跌很難賺錢。量化作爲一個整體,大部分情況下是抑制了市場波動,少部分情況會加大市場波動。量化參與者的專業程度普遍比較高,專業參與者更傾向於逢低買入、逢高賣出,而不是追漲殺跌。同時,在內外部情況發生改變的時候,專業參與者能更快速地推動市場到達新的平衡位置,減少多餘的震盪,增加定價的效率。量化策略整體是收斂和理性的,對波動起到了阻尼的作用。

量化投資與機器學習最新統計顯示,截至2024年二季度末,百億級量化私募的管理規模普遍縮水,幻方目前依舊位於第一梯隊,管理規模在500億元到600億元區間。