搶跑OpenAI 科大訊飛推出中國版“Her”

新京報貝殼財經訊(記者羅亦丹)今年5月,OpenAI曾在發佈會上公開了GPT-4o端到端實時音視頻對話,其因可以理解人類語音中包含的情感而令人倍感驚豔,首席執行官奧特曼更以科幻電影中的智能助手“Her”來稱呼這一產品。

但幾個月過去了,期待中的OpenAI版本“Her”並未公開發布,反倒是中國大模型企業搶先了一步。8月19日,科大訊飛宣佈星火語音大模型更新,正式推出星火極速超擬人交互,並將其能力落地在訊飛星火APP“小星暢聊”功能中。

貝殼財經記者注意到,從官方展示效果來看,該產品的整體交互體驗自然,且可以隨時打斷、插話之後秒回、感知人類情緒,顯然是對標了OpenAI的此前發佈的語音對話功能。科大訊飛方面表示,訊飛星火版“Her”的到來,代表國產大模型開始從追趕、對標到進行自主創新、走出差異化路線。

作爲一家本身就以AI語音技術起家的公司,此次科大訊飛版本的交互產品採用統一神經網絡直接實現語音到語音端到端建模,結合訊飛多維度的語音屬性解耦表徵訓練準則,將內容、音色、情感、語言、風格等信息進行解耦訓練,使得產品能夠更加靈活控制各類元素,讓系統快速落地應用。

科大訊飛方面稱,根據以上技術創新,8月底星火極速超擬人交互將率先全民開放使用,基於全新端到端框架創新基礎上,星火極速超擬人交互目前主要開放語音模態,未來會持續在交互上創新突破。

編輯 閻俠

校對 柳寶慶