☰

谷歌Gemini 2.0 強攻AI代理

谷歌近期接連發布Gemini 2.0系列模型更新消息，2.0 Flash主打適合大規模、高容量、高頻率的任務，開發者可以透過Google AI Studio和Vertex AI平臺使用，打造生產力應用程式；2.0 Pro實驗版則專精於程式編寫，宣稱在程式碼編輯表現和處理複雜指令能力最爲強大。

至於2.0 Flash-Lite，谷歌DeepMind技術長Koray Kavukcuoglu在官方部落格指出，該模型在維持成本和速度的同時，品質也較前一代更爲出色。像是爲大約4萬張不同的照片生成一行相關的標題，且在Google AI Studio的付費方案中，花費不到1美元。按模型所處理每個資料單元的詞元（Token）來看，開發人員輸入Gemini Flash每百萬詞元費用爲10美分，Flash-Lite僅須0.75美分。

AI模型競爭白熱化，谷歌、Meta、亞馬遜、微軟、OpenAI和Anthropic等科技巨頭競相投入資源，加速模型開發，從「一個指令一個動作」升級，以滿足用戶複雜及多步驟的任務需求。

前OpenAI研究高層創立、背後有亞馬遜撐腰的AI新創Anthropic，可謂谷歌在AI代理開發競賽中的勁敵。Anthropic去年10月表示，開發人員可透過API控制機器人Claude自動操作電腦，包括查看螢幕、移動遊標、點擊按鈕和輸入文字。OpenAI近期也發佈類似產品「Operator」，可自動填寫表格、餐廳定位和訂購雜貨等。並在本週推出「Deep Research」，編制複雜的研究報告並分析用戶指定的議題和主題。

谷歌Gemini 2.0 強攻AI代理

相關資訊