輝達慘了?馬雲旗下螞蟻AI大突破:傳使用華爲晶片

輝達的競爭對手?馬雲支持的螞蟻集團(Ant Group Co)使用中國製的半導體來開發訓練AI模型的技術,且成本降低20%。(示意圖/達志影像/shutterstock)

彭博社引述知情人士報導,由馬雲支持的螞蟻集團(Ant Group Co)使用中國製的半導體來開發訓練AI模型的技術,且成本降低20%。

螞蟻集團表示,該公司使用高性能硬體訓練1兆個token的成本約爲635萬元人民幣(約88萬美元),但其優化方法使用低規格硬體訓練1兆個token的成本降至510萬元人民幣。

知情人士表示,螞蟻使用其關係企業阿里巴巴集團控股公司和華爲技術生產的「國產晶片」,來訓練採用「混合專家」(Mixture of Experts,MOE)機器學習與深度學習架構的AI模型,所得到的結果與採用輝達H800等晶片相似。知情人士表示,螞蟻仍在使用輝達晶片開發AI系統,但現在其最新的模型主要依賴其他公司的晶片,包括超微的晶片和中國製晶片。

這些AI模型意味着螞蟻加入了美中兩國企業的競爭。自從DeepSeek展示如何以遠低於OpenAI和谷歌的成本訓練出性能強大的AI模型以來,這場美中企業之間的競爭便愈演愈烈。這也凸顯出中國企業多麼想讓中國製晶片來取代輝達最先進的半導體。

MoE模型的訓練通常仰賴高效能晶片,如輝達的GPU。到目前爲止,其成本對許多規模較小的公司而言實在高不可攀,也限制了該AI模型的普及。螞蟻一直致力於如何更有效地訓練LLM,並消除這樣的限制。該公司的報告標題明確表示,其設定的目標是「不使用高階 GPU來擴展模型」。

這與輝達打的如意算盤背道而馳。上週在GTC年度開發者大會上,輝達執行長黃仁勳表示,即使出現像DeepSeek R1如此低成本高效能的AI模型,但運算需求仍將大幅成長。他認爲企業需要的是更好的晶片來創造更多的收入,而非使用較便宜的晶片來降低成本。

今年初,中國新創公司DeepSeek號稱以極低成本、較少的AI晶片就打造出極具競爭力旳AI模型,這令投資人對估值已高的輝達及其昂貴的AI晶片信心動搖,使輝達股票一度遭到拋售。