不是用輝達GPU!蘋果揭露靠Google自研晶片訓練AI模型

蘋果表示,支撐其AI系統Apple Intelligence的人工智慧模型是靠Google設計的處理器進行預先訓練。美聯社

蘋果公司週一(29日)表示,支撐其AI系統Apple Intelligence的人工智慧模型是靠Google設計的處理器進行預先訓練。這顯示蘋果並非是使用輝達(Nvidia)的晶片來訓練AI模型,也是大型科技公司在訓練先進AI方面尋求輝達晶片以外替代品的一個跡象。

蘋果發表一篇技術報告,詳述選擇採用Goolge開發的兩種TPU(Tensor Processing Unit,張量處理器)進行AI模型訓練,這些處理器構成了大型晶片叢集。爲了建立在iPhone和其他裝置上運作的AI模型,蘋果使用了2,048個TPUv5p晶片;在伺服器AI模型中,蘋果部署8,192個TPUv4處理器。

蘋果決定採用Google的雲端基礎設施來訓練AI模型,是值得注意的,因爲輝達所生產的AI處理器是目前業界最熱門的。包含計算Google、亞馬遜和其他雲端運算公司生產的晶片在內,輝達佔了大約80%市佔。

在研究報告中,蘋果沒有表明未使用輝達晶片,但在描述其AI工具的硬體和軟體基礎與功能時,並沒有提到輝達的軟體。

路透說,無法立即連絡到蘋果公司提出迴應。Google沒有回覆置評請求,輝達則不願置評。

輝達並不設計TPU,而是聚焦廣泛用於AI的繪圖處理器(GPU)。

Google是透過其雲端平臺Google Cloud Platform銷售能使用其TPU的權利,這點和輝達獨立銷售晶片與系統的做法不同。有意購買TPU使用權的客戶,必須透過Google的雲端平臺構建軟體,才能使用TPU。

蘋果在47頁的報告中沒有提到Google或輝達,但確實指出其蘋果基礎模型(AFM)和AFM伺服器是在「雲端 TPU叢集」上進行訓練。這代表蘋果是向雲端業者租用伺服器來執行運算。

蘋果工程師在研究報告中表示,使用Google的晶片可以創造出比報告中討論的兩款模型更龐大、更復雜的模型,「這系統讓我們能夠有效率地訓練AFM模型而且可以擴容,包括終端裝置上的AFM、AFM伺服器與更大的模型。」

蘋果本週將向其測試版用戶推出Apple Intelligence功能。

蘋果在6月的開發者大會上發表一系列新的AI功能,包括將OpenAI的ChatGPT技術整合到其軟體中。