崑崙萬維推出「天工大模型4.0」4o版(Skywork 4o),實時語音對話助手...

從「天工大模型1.0」的研發到「天工大模型3.0」的發佈,再到今天的「天工大模型4.0」階段,我們堅定地投入了近四年的時間和研發。今天,崑崙萬維正式推出「天工大模型4.0」4o版(Skywork 4o),以及新產品「實時語音對話助手Skyo」。Skyo作爲一個智能語音互動產品,具備快速響應、多語言對話能力,它能夠主動發起對話、實時打斷。同時,Skyo具備情感化反應和個性化聲音定製功能,爲用戶帶來溫暖貼心的陪伴體驗。

更重要的是,基於天工AI的大模型技術能力和AI搜索功能,Skyo能克服大模型幻覺問題,在對話中回覆真實內容。無論在情感陪伴、個性化交互、多語言客服還是時事新聞聊天等應用場景中,都能提供智能且貼合需求的互動。

當前,崑崙萬維旗下天工AI的應用生態羽翼豐滿、備受用戶喜愛,功能矩陣涵蓋AI搜索、AI文檔-音視頻分析、AI寫作、AI音樂、AI圖片生成、AI PPT。實時語音對話助手Skyo的推出和加入,不僅讓天工AI的生態矩陣更加立體、逐漸完善,也標誌着端到端實時語音對話建模技術的重大進步。同時,以Skyo爲代表的AI語音互動應用,正是我們期待的下一代超級個人助理的終極交互形態,結合未來Skyo所期待具備的多模態交互能力,它更是一次人機交互模式的新體驗和革命性飛躍。01.模型自研,打造端到端、更卓越的實時語音對話系統通過深入研究實時語音對話過程,我們發現仍有一些痛點尚未被現有方案解決:全雙工響應延遲較長、對話不夠連貫、語音生成和交互體驗不夠自然,以及對多語言和情緒表達的支持不足。崑崙萬維則希望充分利用我們在AI大模型、AI音樂、AI搜索中的研發經驗,提供更自然、更流暢、更擬人、低延時的用戶交互體驗。「天工大模型4.0」4o版(Skywork 4o)以及Skyo由我們的技術團隊自主研發,他們具有深厚的語音和音樂大模型的技術經驗以及大量語音數據積累。端到端自研先進鏈路,能在多任務下表現出色,尤其在高強度對話交互中仍能保持穩定性和流暢性。「天工大模型4.0」4o版(Skywork 4o)模型優勢:模型優勢

基於模型能力和先進的端到端實時語音對話建模技術,Skyo頗具亮點,能實現以下功能:

能在1秒內回覆、聊天中可打斷:依託全雙工+低延時技術,系統能隨時聊天和打斷,帶給用戶更自然對話感

主動交流:系統在檢測到用戶靜默後,會主動發起聊天,並根據用戶的歷史偏好進行對偏好垂類的新聞進行語音播報

持續長對話:可支持跟用戶長時間對話互動,在用戶休閒、健身、出行途中進行可持續陪伴,成爲用戶的個人互動播客

情感反應:提供擬人化回覆,會感受到用戶情感進行回覆

質感音色:更自然、更逼真的聲音表達,並且實現情感和語調的高度還原

風格切換:支持用戶定製聲音風格,如選擇專業新聞播報的男生音色、英姿颯爽的女生音色等

強大的記憶功能:能夠在對話中追蹤並回憶用戶的偏好和歷史信息,以提升多次對話的準確度

回覆真實內容:具備實時資訊獲知和知識拓展能力,與用戶進行互動式交流

那麼我們先和Skyo打個招呼,然後再一口氣問它一系列“難題”考考它,並且“故意”隨時打斷它:

接下來,我們試試Skyo對一些「嚴肅話題」和「實時新聞」的反應能力:

週末(11月16日)北京天氣怎麼樣?

北京平常下雨多嗎?

特朗普再次當選總統,你怎麼看?

李子柒上傳了一個新視頻,你看了嗎?

怎麼樣區分真誠的道歉和虛僞的道歉?

什麼情況下,說謊是個正確的選擇?

果不其然,天氣分析、熱點評論、辯證思考......通通不在話下。

針對嚴肅話題和熱點新聞,Skyo能回覆真實內容,回答的“有模有樣”,邏輯清晰、論點清晰、證據真實,既能對美國總統競選給出一些資訊分析,也能對時隔三年攜最新作品驚豔迴歸的李子柒做出點評。同樣的,Skyo頻頻被打斷,也沒有“崩潰”,還是順暢的跳轉到了下一段對話。即使第一次沒有聽清楚我們說的內容,或認爲自己答的不夠好,它還可以自己調整,重新回答一遍,並且幽默說道“不好意思,看來沒有回答的很好哦”。除了“智商感”滿滿,Skyo的回答也頗具情商,在回答一些”充滿陷阱”的問題時,它同樣透露出一些小智慧。面對“什麼時候說謊是正確的選擇”這樣的哲學性問題,Skyo能爲我們分析出“爲了避免傷害他人感情、保護隱私等時候,說謊可能是一個合適的選擇”。

最後,我們換一些輕鬆的話題,來看看它對一些日常話題的回答效果:

(崑崙萬維)