微軟AI CEO蘇萊曼專訪:揭秘與OpenAI o1關係,Copilot目標是情感支持

智東西編輯 Panken

智東西10月18日消息,近日,微軟AI CEO穆斯塔法·蘇萊曼(Mustafa Suleyman)接受WIRED專訪,詳細解讀了微軟Copilot願景、AI智能體(AI Agent)的三個階段、微軟與OpenAI的關係、AI後續挑戰等焦點話題。

蘇萊曼說,微軟Copilot旨在創造一種夥伴間的持續互動體驗,不僅關乎技術,更在於提供情感支持;AI智能體分爲信息處理、長期記憶、交互三大階段;微軟對OpenAI的模型進行了微調,使其不僅專注於解決數學和科學問題,還能進行並列比較和消費者分析。

微軟本月宣佈其AI助手Copilot升級類似人類的聲音、能看到用戶的屏幕、擁有更好的推理能力。對此蘇萊曼稱,這都是讓用戶重新愛上PC的計劃的一部分。

微軟全球資深副總裁、微軟AI亞太區總裁張祺博士總結了此次訪談的啓示:

“2024年諾貝爾獎的各個獎項已經全部揭曉,令人矚目的是,諾貝爾物理學獎與化學獎雙雙花落AI領域。AI技術及其應用成爲今年諾獎最大的亮點。諾獎對AI相關成果及科學家的高度認可,不但有力地推動了AI技術的進一步發展和跨學科研究的深化,也預示着AI將以更快的速度推動人類社會的經濟增長和高質量發展。

AI的發展速度驚人,這在人類歷史上尚屬首次——機器學會了運用我們的語言。但AI所提供的信息能否符合人類的認知需求和價值判斷?AI能否真正理解語言背後的情感內涵?在AI與人類深度交互的背景下,如何確保數據和隱私安全?從長遠來看,哪些挑戰可能成爲制約AI可持續發展的根本性因素?

在直面這些難題的同時,蘇萊曼先生對如何最大限度利用技術滿足用戶需求給出了一個清晰的路線圖。他探討了人工智能的發展、倫理問題以及未來的技術前景。這正是本次蘇萊曼先生採訪帶來的啓示 。”

以下是穆斯塔法·蘇萊曼與WIRED資深記者Will Knight的深度訪談實錄:

一、Copilot目標提供情感支持,Vision功能完全保護用戶隱私

主持人:Copilot的新願景是什麼?

穆斯塔法·蘇萊曼:我們正處於一個驚人的轉型點。AI夥伴現在能夠看到我們所見,聽到我們所聽,並使用我們溝通的同一種語言。這種新的設計理念關注的是持久性、關係和情感。我正在打造一種體驗,是關於與夥伴進行持久、持續互動。

主持人:你從Inflection AI加入微軟,該公司專注於構建支持性和同理心的AI。聽起來你把這種理念帶到了新的僱主這裡。

穆斯塔法·蘇萊曼:我一直相信AI有提供支持的潛力。情感支持實際上是我19歲時開始工作的第一個項目,那時我啓動了一項電話諮詢服務。這正是這個技術時刻的美妙之處——體驗與一個真正瞭解你的AI夥伴互動。它會指導你、鼓勵你、支持你、教導你。我認爲這將不再讓人感覺像是在跟一臺計算機互動。

主持人:Copilot Vision是什麼?這個“實驗室”功能將讓Pro用戶嘗試到什麼?

穆斯塔法·蘇萊曼:Copilot Vision讓你能夠說“那邊的東西是什麼[在你的屏幕上]?”或“等一下,那是什麼?你覺得那個怎麼樣?”在你坐在電腦前時,會有很多這樣的小瞬間。這個AI夥伴可以看到你所見,並實時與你討論你正在看的內容,這是非常了不起的。它在某種程度上改變了你在數字生活中的體驗,因爲你不必再費力輸入內容。

主持人:這聽起來像是Recall,那項有爭議的、現在需要選擇的Windows功能,用於記錄用戶屏幕上的內容。

穆斯塔法·蘇萊曼:保護用戶的隱私是至關重要的。目前我們不會用Copilot Vision保存任何內容,因此一旦會話結束後關閉瀏覽器,所有內容都會消失,完全刪除。但我在思考是否以及如何在未來引入這一功能,因爲很多人確實希望有這樣的體驗。

如果你可以說,“我前幾天在網上看到的那張圖片是什麼?那個表情包是什麼?”我想我們總有一天得研究這個問題。不過目前,Copilot Vision工具是這樣的。我們需要隨着時間進行實驗,看看如何在這方面做更有意義的事情。

二、新功能類似於OpenAI“草莓”模型,針對消費者需求作調整

主持人:你們還推出了Think Deeper,這將使Copilot能夠處理更復雜的問題。這是基於OpenAI的o1模型,也就是Strawberry,對嗎?

穆斯塔法·蘇萊曼:是的,類似於Strawberry。我們對OpenAI的模型進行了調整,爲了更符合消費者的需求,我們讓它以一種更符合AI夥伴主題的方式運行。

主持人:有什麼區別?

穆斯塔法·蘇萊曼:OpenAI的模型更專注於純數學和科學問題的解決。我們試圖讓它專注於並列比較和消費者分析等內容。當你在解決一個難題時卡住了,想要推理時,它可以真正列出一個並列比較,或者進行大規模分析。

主持人:微軟的人們已經在使用這個新版本的Copilot了嗎?

穆斯塔法·蘇萊曼:是的,大家都在使用。我們幾天前剛在公司內部全面上線。所以每個人都在使用,並且提供大量反饋。我們的反饋渠道非常繁忙,這很有趣。

三、朝AI夥伴邁進一步,AI智能體三大階段解讀

主持人:人們會記得Clippy,微軟最後一個Windows AI助手。那裡的員工有看到相似之處嗎?

穆斯塔法·蘇萊曼:我前幾天見到了比爾·蓋茨,他說,你知道嗎,你給整個AI的命名搞錯了?應該叫Clippy(回形針)。這確實顯示了蓋茨這樣的人的前瞻性。他們不僅能預見未來兩年,還能預見未來二十年。

主持人:新功能是否是朝着所謂的AI夥伴邁進了一步,AI夥伴可以在電腦上幫你處理有用的瑣事嗎?

穆斯塔法·蘇萊曼:是的,絕對是。

第一階段是AI處理與用戶相同的信息——看到用戶所見、聽到用戶所聽、閱讀用戶閱讀的文本。

第二階段是AI具備長期、持續的記憶,隨着時間的推移建立起共同理解。

第三階段是AI通過發送指令和採取行動與第三方互動——比如購買東西、預訂東西、規劃日程。

我們正在研發實驗模式中的這兩個功能。

主持人:你們有一個可以爲你去購買東西的Windows AI智能體嗎?

穆斯塔法·蘇萊曼:這還有一段時間,但是的,我們已經形成了閉環,我們已經完成了交易 。這項技術的問題是,你可以讓它在50%到60%的時間裡正常工作,但要讓它達到90%的可靠性還需要付出很多努力。

我已經看到了一些令人驚歎的演示,其中它可以獨立啓動並進行購買等等。但我也見過一些事故的時候,它不知道自己在做什麼。

主持人:能多告訴我一點“事故”的事嗎?它是否用蓋茨的信用卡去買了輛蘭博基尼?

穆斯塔法·蘇萊曼:如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說我們還在一步步摸索。這項技術仍然深處實驗室的困境中,還有很長的路要走,但我想進展可以按季度來計算,而不是按年。

四、AI的未來挑戰:打造可信賴技術,建立親密和個性化體驗

主持人:在實現你所描述的人工智能未來的過程中,你面臨的最大挑戰是什麼?

穆斯塔法·蘇萊曼:最大的挑戰是找出如何打造可信的技術,因爲這將是一種非常親密和個人的體驗。當然我們必須做好安全和隱私的部分。但我認爲真正的關鍵在於設計對話,使AI夥伴能夠明確邊界,能夠說出“這是我不準備參與的事情”。

如果我們能做到這一點,那就是建立可信體驗的基礎,然後我認爲我們可以真正進入複雜的領域,例如如何讓它代表你購買東西、代表你談判、代表你簽訂合同,或者爲你規劃一個週六下午涉及三四個不同站點的日程。你會說,我相信你,Copilot,你能搞定,對嗎?這正是我們正在努力實現的目標。

來源:微軟,WIRED