曝OpenAI神秘大模型“草莓”兩週內發佈!

智東西作者 香草編輯 李水青

智東西9月11日消息,據外媒The Information昨晚報道,OpenAI的新模型“草莓”(Strawberry),將在未來兩週內作爲ChatGPT服務的一部分發布。

“草莓”項目是OpenAI盛傳已久的神秘Q*模型,據傳是此前OpenAI政變大戲的關鍵原因之一。它展現出瞭解答數學問題、複雜編程的強大能力,讓AI安全的研究人員都爲之震驚。

上個月初,OpenAI CEO Sam Altman曾在推特暗戳戳秀自家花園5顆草莓。當時有網友根據草莓成熟時間預測,“草莓”模型或者GPT-5,可能在未來4-6周內發佈。這次曝出的時間點,正好和當初網友的預測對上了。

▲Sam Altman秀草莓

兩位參與模型測試的人員透露了更多該模型的細節。“草莓”與其他對話式AI最大的區別,在於它會在回答之前進行“思考”,這一階段通常持續10~20秒。

此外,“草莓”的初代版本只能接收和生成文本,不能處理圖像等其他多模態信息,這似乎與如今市面上的主流大模型發展方向有些不同。

一、“三思而後答”,初代爲純文本模型

據測試人員透露,“草莓”雖然是ChatGPT的一部分,但它將是一項獨立產品。其具體的服務方式尚不清楚,一種可能是作爲可選擇的模型,在ChatGPT的下拉菜單中提供。

“草莓”最大的特點,就是會在回答前進行“思考”,而非立即給出響應。這一階段通常持續10~20秒。

思考階段有助於模型避免出錯,這段額外的時間也使“草莓”更有可能知道何時需要向用戶提出後續問題,以便提供更全面的解答。這既可以視作深思熟慮的優點,但同時也可以視作反應遲鈍的缺點。

此外,“草莓”的初代版本只能接收和生成文本,不能處理圖像等其他模態信息。而如今市面上大多數大模型都是多模態的,純文本似乎是一個明顯的弱點,這可能反映了OpenAI在發佈產品上面臨的壓力。

二、或將以速率限制收費,無需“思維鏈提示

價格方面,“草莓”的定價可能與OpenAI的聊天機器人不同,後者有免費和訂閱兩種級別。據另一位瞭解該產品的人士稱,它可能會有速率限制,限制用戶每小時發送的最大消息數量,並且可能會有響應速度更快的高價級別。

與OpenAI目前最強的模型GPT-4o相比,“草莓”可能更擅長處理複雜、多步驟的問題。目前,用戶在使用ChatGPT時往往需要輸入各種額外的提示詞,才能得到理想的答案,也就是所謂的“思維鏈提示”,例如告訴聊天機器人逐步展示其推理過程。“草莓”的功能旨在避免這些步驟。

這意味着,“草莓”不僅在數學問題和編程方面會表現更佳,而且在更“主觀”的商業任務上也會表現更好,比如頭腦風暴制定產品營銷策略等。在這類任務中,該模型將提供更符合用戶公司特定情況且更詳細的建議。

三、思考模式存在弊端,記憶能力仍有待提升

但在模型發佈之前或之後,OpenAI可能還有一些問題需要解決。

例如,儘管從理論上講,當“草莓”被問到簡單問題時,能夠跳過思考步驟直接回答,但一位測試人員說,在實際操作中模型並不總是這樣做。它可能會錯誤地花費太長時間,來回答那些其他模型可以立即回答的問題。

一些使用過“草莓”原型的人抱怨,與GPT-4o相比,它雖然響應略好一些,但並不值得額外等待10~20秒。

此外,雖然“草莓”旨在在回答新問題之前,記住並整合前面的聊天記錄,用以滿足用戶的特定偏好,但模型在這方面有時也存在問題。

結語:OpenAI憑藉“草莓”重振旗鼓?

不可否認,OpenAI在很長一段時間內都是大模型產品領域的領頭羊,但它面臨的競爭日益激烈。

例如在上個月,谷歌對標GPT-4o的AI語音助手Gemini Live已經廣泛落地,其能夠靈活處理用戶的打斷和突然的話題變化。OpenAI在5月首次發佈了AI語音助手GPT-4o Voice,但隨後爲了改進安全措施而推遲了發佈。

“草莓”能否幫助OpenAI恢復勢頭,我們拭目以待。