谷歌Gemini 2.0 強攻AI代理

谷歌近期接連發布Gemini 2.0系列模型更新消息,2.0 Flash主打適合大規模、高容量、高頻率的任務,開發者可以透過Google AI Studio和Vertex AI平臺使用,打造生產力應用程式;2.0 Pro實驗版則專精於程式編寫,宣稱在程式碼編輯表現和處理複雜指令能力最爲強大。

至於2.0 Flash-Lite,谷歌DeepMind技術長Koray Kavukcuoglu在官方部落格指出,該模型在維持成本和速度的同時,品質也較前一代更爲出色。像是爲大約4萬張不同的照片生成一行相關的標題,且在Google AI Studio的付費方案中,花費不到1美元。按模型所處理每個資料單元的詞元(Token)來看,開發人員輸入Gemini Flash每百萬詞元費用爲10美分,Flash-Lite僅須0.75美分。

AI模型競爭白熱化,谷歌、Meta、亞馬遜、微軟、OpenAI和Anthropic等科技巨頭競相投入資源,加速模型開發,從「一個指令一個動作」升級,以滿足用戶複雜及多步驟的任務需求。

前OpenAI研究高層創立、背後有亞馬遜撐腰的AI新創Anthropic,可謂谷歌在AI代理開發競賽中的勁敵。Anthropic去年10月表示,開發人員可透過API控制機器人Claude自動操作電腦,包括查看螢幕、移動遊標、點擊按鈕和輸入文字。OpenAI近期也發佈類似產品「Operator」,可自動填寫表格、餐廳定位和訂購雜貨等。並在本週推出「Deep Research」,編制複雜的研究報告並分析用戶指定的議題和主題。