ChatGPT 高級語音模式究竟有何獨特魅力?

早在五月,OpenAI 宣佈爲 ChatGPT 推出高級語音模式。該公司將這一新功能描述爲當時已有的語音模式的強化版。您在想要改變話題時可以打斷機器人,ChatGPT 會理解您的語速和語調,並以自身的情感做出相應迴應。

如果這聽起來有點像 2013 年電影《她》中的人工智能語音助手,那並非偶然。事實上,OpenAI 展示該產品時使用的聲音與爲那個虛構的機器思維配音的女演員斯嘉麗·約翰遜的聲音有點太相似了。約翰遜提起了訴訟,於是該公司後來完全刪除了這個聲音。不過沒關係,還有另外九種聲音供您嘗試。

雖然 OpenAI 早在七月就開始與一小羣測試人員對高級語音模式進行測試,但該功能現在正在向所有付費用戶推出。如果您有符合條件的賬戶,您今天應該能夠在您的終端進行嘗試。

目前,只有付費的 ChatGPT 訂閱用戶可以訪問高級語音模式。這意味着您需要擁有 ChatGPT Plus 或 ChatGPT Teams 會員資格,才能看到該功能。免費用戶仍然可以使用免費語音模式,在應用程序中顯示爲一副耳機。

高級模式以一個波形圖標呈現,只有 Plus 和 Team 訂閱用戶才能看到。

若要訪問該功能,您需打開新的聊天然後點擊此圖標。首次使用高級語音模式時,您得從九個選項裡挑一種語音。我已經把 OpenAI 對每種語音的描述包含進來了:

我最後選了 Arbor,它讓我多次想起 Headspace 裡的那個人。從這兒開始,高級語音模式的工作方式跟標準語音模式特別相似。

在使用新模式的這一小段時間裡,我沒察覺到跟之前的語音模式相比有太多進步。新的語音當然是新的,而且我覺得比過去的語音要更“自然”點兒,但我覺得對話沒感覺更逼真。能夠打斷您的數字夥伴這一點確實在一定程度上造成了這種錯覺,不過它很敏感:當 ChatGPT 正說着話時,我拿起了我的 iPhone,它馬上就停了。這也是我在 OpenAI 的原始演示裡注意到的一點,我覺得 OpenAI 得努力提升機器人理解用戶想要打斷的能力,還有區分隨機外部聲音的能力。

(OpenAI 建議您使用耳機以避免不必要的干擾,並且,如果您使用的是 iPhone,啓用語音隔離模式。我在沒有耳機的情況下使用了語音隔離模式,所以您看着辦。)

雖然 OpenAI 似乎已經削弱了 ChatGPT 異想天開和輕浮的特質,但如果您要求,您仍然可以讓該機器人笑——如果您要求它笑的話。我猜這種笑挺讓人印象深刻的,但感覺不自然,就好像它是從另一個錄音中“抽取”來笑的。然而,要求它發出任何其他類似的聲音,比如哭或尖叫,它都會拒絕。

我試圖讓我的語音模式聽一首歌並識別它,但它說它做不到。該機器人特別要求我只分享歌詞,我照做了,然後它根據這些歌詞的氛圍而不是實際歌詞本身推薦了一首歌。因此,它這猜測錯得離譜,但它似乎還不適合這種類型的任務,所以我就放過它了。

我不得不讓兩種語音模式相互較量。第一次嘗試時,它們在一次完全尷尬的交流中不斷互相打斷,直到其中一個出了故障,最後重複了之前跟我說的關於分享歌詞來識別歌曲的信息。另一個接着說了類似的話:“當然,跟我分享歌詞,我會幫你弄清楚。”另一個回覆道:“當然:分享歌詞,我會盡力識別這首歌。”就這樣來來回回持續了五分鐘,之後我結束了對話。

一旦我爲聊天機器人設置了清晰的聊天,它們就會永遠來回交流,幾乎沒有說任何有趣的內容。它們帶着聊天機器人常見的熱情和模糊性談論增強現實、烹飪和早晨的日常。然而,奇怪的是,當其中一個機器人說完如果它會做飯,它想做千層麪之後;它問另一個聊天機器人喜歡做什麼菜或者想嘗試做什麼菜。另一個機器人回答:“用戶喜歡早上喝咖啡和看新聞。”

這是我在過去的一次測試中告訴 ChatGPT 的,當時它問我早上的日常。這證明OpenAI 的記憶功能在起作用,但這執行情況,嗯,很奇怪。爲什麼它會這樣回答關於最喜歡的食譜的問題?是我讓機器人短路了嗎?它是否發現自己在和自己聊天,並決定警告另一個機器人發生了什麼?我真的不喜歡這裡面的含義。

當您使用先進語音模式時,OpenAI 會保存您的錄音,其中包括您在對話中的錄音。當您刪除聊天時,OpenAI 表示將在 30 天內刪除您的音頻錄音,除非該公司因安全或法律原因決定保留。如果您之前共享過音頻錄音,並且此音頻剪輯與您的賬戶分離,OpenAI 也會在您刪除聊天后保留該錄音。

爲確保您不讓 OpenAI 用您的語音錄音和聊天記錄來訓練其模型,請轉到 ChatGPT 設置,選擇數據控制,然後禁用爲所有人改進模型和爲所有人改進語音。