5000億參數!傳微軟準備推出自研大模型

5月7日消息,美國時間週一,有報道稱微軟正在訓練名爲MAI-1的內部人工智能語言模型,其規模可與谷歌和OpenAI的大模型相媲美。

根據兩名微軟員工的說法,MAI-1模型由最近微軟挖來的谷歌DeepMind聯合創始人、人工智能初創公司Inflection前首席執行官穆斯塔法·蘇萊曼(Mustafa Suleyman)負責。

據悉,微軟還未明確MAI-1模型的確切用途,具體取決於模型效果如何。報道稱,微軟可能會在本月晚些時候召開的Build開發者大會上預覽這款新模型。

微軟對此拒絕發表評論。

據報道,MAI-1規模將比微軟之前訓練的小型開源模型“大得多”,這意味着其也會更加昂貴。

上個月微軟推出了一款名爲Phi-3-mini的小型人工智能模型,希望用有成本效益的產品吸引更多客戶羣體。

微軟向OpenAI投資了上百億美元,並在旗下生產力軟件中部署OpenAI的人工智能技術,從而在生成式人工智能領域的早期競賽中取得了領先地位。

據報道,爲了提升該模型,微軟已經配置了裝備了英偉達GPU的大型服務器集羣,並儲備了大量數據。

報道稱,MAI-1將有大約5000億個參數。相比之下,OpenAI的GPT-4據稱有1萬億個參數,Phi-3 mini有38億個參數。

今年3月份,微軟任命蘇萊曼爲新成立的消費級人工智能部門負責人,同時還聘用了Inflection的幾名員工。

報道補充說,新模型並不是源自Inflection,但可能用到了這家創業公司的訓練數據。(辰辰)