李開復談大模型價格戰:推理成本將每年降10倍,但瘋狂降價是雙輸

21世紀經濟報道記者白楊 北京報道

市場久違的價格戰,正在大模型領域上演。

5月21日上午,阿里雲宣佈通義千問大模型降價,其中Qwen-Max模型價格降至0.04元/千tokens,降幅達67%,而主力模型Qwen-Long的價格降至0.0005元/千tokens,降幅達97%。

降價後,通義千問大模型的最低價格已經達到1元200萬tokens。

當天下午,百度雲採取了更激進的策略,直接宣佈文心大模型兩個主力模型(ERNIE Speed和ERNIE Lite)將全面免費。這也意味着大模型邁入了免費時代。

在此之前,率先打響價格戰的是字節跳動旗下的火山引擎。5月15日,火山引擎發佈豆包大模型,並宣佈豆包通用模型pro-32k在企業市場的定價爲0.0008元/千 tokens,相當於1元125萬tokens,號稱比行業便宜99.3%。

推理成本將一年降10倍

對於這一輪大模型降價,零一萬物CEO 李開復向21世紀經濟報道表示,未來整個行業的推理成本每年降低10倍是可以期待的,而且這個趨勢是必然的。對於行業來說,現在模型的API調用還是非常非常低的比例,如果推理成本一年降低10倍那就有更多的人可以用上大模型,這是非常利好的消息。

然而,對於激烈的價格戰,李開復指出,類似於ofo的瘋狂降價是一種雙輸的策略。他認爲大模型公司應該不會這麼不理智,因爲技術還是最重要的,如果技術不達標,僅僅依靠賠錢做生意是不可持續的,零一萬物也絕對不會跟這樣的定價來做對標。

據記者瞭解,零一萬物最新發布的Yi-Large模型的定價是20元100萬tokens。李開復稱,“我們現在還沒有調整價格的打算,Yi-Large上線後的反饋是非常正面的,也有很多忠誠的愛好者已經加入,我們先服務好他們”。

不過,李開復也坦言,“如果以後中國大模型市場就是這麼卷,大家寧可賠光通輸也不讓你贏,那我們就走外國市場”。

談到零一萬物的商業化策略,李開復表示,“我們也在走企業級方向,但是初步用戶會在國外”。他認爲,國外用戶的付費意願和金額遠高於國內,因此儘管零一萬物也非常希望服務國內企業,但是按照現在國內TOB卷的情況,我們可能做一單賠一單,這種情況在AI1.0時代看的太多,所以零一萬物將堅決不做。

差距從7-10年縮短至6個月

過去一年多,中國大模型一路狂奔,並取得了諸多進展。

“現在如果用國際最好的大模型和國內最好的大模型相比,那還是有一定的差距。但同時要考慮的是,比如谷歌團隊是2000人,OpenAI是1000人,而像零一萬物把模型加infrastructure團隊加起來也不到100人,更不用說使用的GPU算力不到他們十分之一,模型尺寸也不到他們的十分之一了”。李開復說。

所以從效率上來講,中國大模型的已經遠遠超過國際頂尖大模型。李開復也提出,“一年前我們落後OpenAI跟谷歌開始做大模型研發的時間點有7到10年,那現在我們跟他們的差距只有6個月左右。”

據零一萬物披露,在LMSYS盲測競技場最新排名中,零一萬物的Yi-Large總榜排名世界模型第七,中國大模型中第一,已經超過Llama-3-70B、Claude 3 Sonnet。

“我們發佈的模型在今年5月的時候,可以打敗去年11月之前的任何模型,這也是落後6個月差距的由來”。李開復說,但在其看來,這6個月的差距也不是很大,因爲中國在以一個不可思議的超級速度進行追趕。

比如在算力方面,國外廠商確實有更大的優勢,但是,中國廠商能夠把同樣的一張GPU擠出更多價值來,這是中國廠商能夠達到現在水平的重要理由。

另外在模型優化方面,不只是純粹的科技和算法問題,還涉及數據配比、優化訓練等各種方面的技術,在這些方面,中國廠商也不輸於美國。

“我在寫《AI·未來 》這本書時提到,美國在做突破性科研方面,全世界沒有對手。但是在同一本書裡我也提到,中國人的聰明、勤奮、努力是不容忽視的。後發有後發的優勢,美國的創造性,我們有很多學習的地方,但是比執行力,比做產品,我們強於美國公司”。李開復說。