ChatGPT 年底重磅第六彈來了,視頻通話+屏幕共享全都有,還有一個聖誕彩蛋
繼昨日 ChatGPT 全面登陸蘋果全家桶之後,OpenAI 又帶來了重磅更新。
今天,ChatGPT 推出了視頻通話和屏幕共享功能以及一款聖誕老人限定語音「Santa Mode」。
也就是說,現在 ChatGPT 不僅伶牙俐齒,還能「睜眼看世界」。遇事不決,直接給 ChatGPT 打「視頻通話」,或許它能夠更好地幫助你解決問題。
這些功能將在未來一週內推送給所有 Team 用戶和大部分 Plus 和 Pro 訂閱用戶。歐盟地區的付費用戶還需要再等等。
支持 50 多種語言的 ChatGPT 將能夠實時理解視覺場景,幫助你解決問題,甚至化身 AI 導師教你掌握新事物。
在這場同樣不到 20 分鐘的發佈會上,由 OpenAI 首席產品官 Kevin Weil、Jackie Shannon、Michelle Qin 和 Rowan Zellers 等人向我們展示長了「眼睛」的 ChatGPT 究竟能幹些什麼?
比如說,當你入手了一套手衝咖啡設備卻不知從何入門時,不妨給 ChatGPT 打一通「視頻通話」。
它就能根據你面前的器具,手把手教你完成每一個步驟,從放置濾紙、倒熱水、將磨好的咖啡粉放入濾紙中等等,包教包會。
卡殼了?隨時提問 GPT 老師。這位 AI 老師不僅有問必答,偶爾還會人性化地給予鼓勵,情緒價值拉滿。
除了實時視頻指導,ChatGPT 還支持屏幕共享功能。用戶只需點擊右下角的高級語音模式圖標,在下拉菜單中選擇分享屏幕,就能獲得針對性的幫助。
當「看」到朋友穿着聖誕老人的裝扮,調侃是否有資格應聘購物中心的聖誕老人崗位時,GPT 老師會給出得體的措辭建議以及高情商的鼓勵。
實際上,OpenAI 總裁 Greg Brockman 前不久也與安德森·庫珀(Anderson Cooper)利用帶視覺功能的 ChatGPT 進行了關於人體解剖學的知識小測驗。
當庫珀在黑板上畫出身體部位時,ChatGPT 能夠瞬間「理解」他所畫的內容。
「位置非常到位,大腦就在頭部那裡。至於形狀,這是一個不錯的開始,但大腦更像是一個橢圓形。」甚至,ChatGPT 還能用英式口音演唱三角形面積公式。
但後續 ChatGPT 處理幾何問題時卻出現明顯的紕漏,沒能發現一個簡單的標註錯誤,在理解平面幾何的能力上仍有許多提升空間。
爲了迎接聖誕的到來,OpenAI 還特別推出了「聖誕老人」預設語音,用戶只需點擊主屏幕上的雪花圖標,就能和 ChatGPT 聖誕老人聊天。
比如讓聖誕老人講個故事。
不得不說,每次「聖誕老人」開口的「Ho Ho Ho~」相當魔性,聽着就很有節日氣氛。
在直播活動過程中,主持人也向這位「聖誕老人」詢問幾個問題,包括但不限於最喜歡的聖誕傳統、最喜歡的馴鹿等等。
有趣的是,當 Kevin Weil 戴上聖誕老人的假鬍子詢問如何保養時,給出建議的 ChatGPT 還會用聖誕老人的口吻迴應道:
「朋友,這是我見過的最威武的鬍子。」
這款語音將在今天推出,而爲了讓每個用戶都能充分體驗這個節日彩蛋,首次體驗時 OpenAI 會重置用戶的高級語音使用次數,即使用完額度,用戶也能繼續通過標準語音模式與「聖誕老人」互動。
或許是因爲發佈會戰線拉得太長,網友的吐槽聲也聚焦到了這款聖誕老人語音上。最典型的例子當屬 X 網友@khoomeik。
Google Deepmind 研究科學家 Jonas Adler 更是直接嗆聲 OpenAI:
值得一提的是,昨天,Google 搶先一步推出了具備視覺理解能力的 AI 產品,能夠理解並解析用戶所處的實際場景,且收穫網友的一衆好評。
到了今天,OpenAI 也緊隨其後,爲 ChatGPT 裝上了「眼睛」,這也意味着 ChatGPT 從相對單一的模態,進一步拓展至「視覺—語言多模態理解」。
換言之,ChatGPT 將不再侷限於用戶輸入的文字指令與信息,而是能夠通過視覺來理解用戶所處的上下文環境,包括電腦屏幕上的頁面、手機攝像頭所捕捉的影像、甚至其他外設的實時畫面。
如果說半個世紀前,施樂 PARC 實驗室的科學家們幻想過一臺能看懂人類行爲的計算機。今天 AI 的發展,正在把這個夢想變成了顯示器之外的現實。
從紙到鍵盤,從二進制到自然語言,人類一直在簡化與機器的溝通方式。而 ChatGPT 的視覺能力也讓我們看到了終極答案,那就是讓機器像人一樣「看」這個世界。
考慮到 Altman 和前蘋果首席設計官 Jony Ive 一直在開發智能 AI 硬件設備,我更期待看到這項功能出現在這款新硬件上。
AI 睜開眼睛的那一刻,也終於走進了人類眼中的世界。