華福證券:DeepSeek帶來的AI變革
智通財經APP獲悉,華福證券發佈研報稱,AI全球競爭時代來臨,看好以爲DeepSeek爲代表的中國大模型的崛起,尤其看好AI應用和AI終端的落地。預期未來推理成本仍將顯著增長,全球AI競爭背景下,國產替代是算力增長核心。
華福證券主要觀點如下:
一、用戶量:海外加速出圈,迅速登頂全球下載榜單
1、網頁端:重度用戶爲主,DeepSeek在24年12月26日推出V3(對標GPT4o),因其顯著的性能,用戶迅速開始增長,同時在1月20日發佈R1(對標GPT-o1)後,進一步出圈。
2、APP端:大衆用戶爲主,R1推出後,追平GPT-o1,迅速出圈海外。根據點點數據,從DeepSeek在美國下載排名從1月22日的201名,迅速在1月27日登頂第一名;根據七麥數據,截止1月30日,DeepSeek在168個國家位居下載榜第一名。
二、DeepSeek偏好激進性創新:架構(MOE+MLA)+精度(FP8)
1、MOE架構創新:相比過去主流模型的MOE專家模型停留在8~16個,而DeepSeek每個MoE層包含1個共享專家和256個路由專家,有助於降低模型推理時激活的參數量。
2、MLA架構創新:MLA通過聯合壓縮鍵值矩陣爲低秩向量,將多個頭的鍵值信息融合,使推理時僅需緩存少量低秩向量,大幅降低KV緩存需求,減少內存佔用。
3、訓練特色:突破大模型訓練固定思維(一般模型權重和梯度使用FP16,優化器參數使用FP32),敢於嘗試在低精度FP8的模式下訓練大模型,並且該嘗試同樣出現了較好的效果。
三、DeepSeek開源對AI應用和AI終端的影響:產品力競爭時代
DeepSeek從V3到R1,將進一步推動全行業大模型的提升,更快的追趕GPT4o和GPT-o1;同時成本的下降,有助於AI應用和AI終端的普及。未來行業競爭將進入“產品能力競爭”,巨頭的流量優勢將進一步凸顯。
四、DeepSeek對推理成本的影響:用戶規模和使用頻次
未來推動推理成本增加的核心因素:用戶規模和用戶使用頻次的增加。根據Grok創始人,過去60年,每10年計算成本降低約1000倍,但人們的購買量增加了10萬倍,總支出反而增長了100倍。
風險提示:AI競爭激烈,AI發展不及預期。